live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
22 МАЯ
Daily · HuggingFace · HuggingFace

Специализированные модели: 3B-решения опережают флагманы по всем фронтам

Последние три года в AI-стратегии компаний доминировала простая логика: чем крупнее фронтир-модель, тем безопаснее. Считалось, что возможности масштабируются с числом параметров, а лидеры бенчмарков неизменно предлагают…

3 мин
22 МАЯ
Daily · DeepSeek · X · DeepSeek

DeepSeek-V4-Pro: дисконт, ставший бессрочным

DeepSeek объявила, что скидка на использование модели DeepSeek-V4-Pro теперь действует постоянно. Это не временная акция, а фундаментальное изменение в ценовой политике, позволяющее разработчикам с большей уверенностью…

1 мин
21 МАЯ
Daily · Google · Google

Google DeepMind Accelerator: AI против климатических рисков в АТР

Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…

2 мин
20 МАЯ
Daily · HuggingFace · HuggingFace

Transformers 5.9.0: новые модели и меняющийся интерфейс эмбеддингов

HuggingFace выпустил библиотеку Transformers v5.9.0, добавив три новые модели и внеся важные изменения в обработку текстовых эмбеддингов для ряда моделей компьютерного зрения. Это обновление включает как новые…

3 мин
19 МАЯ
Daily · HuggingFace · HuggingFace

Ettin Reranker: как пересортировать поиск без лишних затрат

Hugging Face представил семейство моделей Ettin Reranker. Это не просто очередной набор инструментов для ранжирования; они спроектированы, чтобы точно переупорядочивать результаты поиска, при этом удерживая контроль над…

4 мин
15 МАЯ
Daily · Together AI · Together AI

Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI

Together AI объединяет усилия с Pearl Research Labs, чтобы радикально изменить экономику инференса AI. В основе нового партнёрства лежит технология Proof of Useful Work, которая позволяет одновременно с вычислениями для…

3 мин
15 МАЯ
Daily · fal · fal

Fal: Безопасность на скорости мысли — подход к доверию в AI

Fal, как поставщик инфраструктуры для искусственного интеллекта, активно выстраивает свою стратегию доверия и безопасности. Шон Бонавиц, руководитель этого направления в компании, делится философией и конкретными шагами…

2 мин
14 МАЯ
Daily · Together AI · Together AI

violin: Открытый AI-перевод видео, который уважает голоса

Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…

3 мин
14 МАЯ
Daily · Black Forest Labs · Black Forest Labs

FLUX Outpainting: ИИ-расширение изображений в один API-вызов, без промтов

Black Forest Labs представила новую возможность для своей линейки FLUX Tools — FLUX Outpainting. Инструмент позволяет расширять любое изображение за его исходные границы, автоматически сохраняя при этом целостность…

3 мин
14 МАЯ
Daily · Tencent · Tencent Hunyuan

StereoCrafter2: Tencent ARC Lab обновила модель для иммерсивного видео

Tencent ARC Lab выпустила обновление своей модели StereoCrafter, получившее название StereoCrafter2. Новая версия нацелена на решение ключевой проблемы в производстве иммерсивного видео: достижение высокой точности и…

1 мин
12 МАЯ
Daily · Together AI · Together AI

Voice Finder от Together AI: 600 голосов теперь можно искать по запросу

Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…

10 мин
11 МАЯ
Daily · Tencent · Tencent Hunyuan

Hy-MT2: многоязычный перевод для сложных сценариев — с оптимизацией для устройств

Tencent Hunyuan выпустила семейство многоязычных моделей перевода Hy-MT2, разработанных для сложных реальных сценариев. Модели доступны в размерах 1.8B, 7B и 30B-A3B (MoE), поддерживают 33 языка и демонстрируют…

3 мин
06 МАЯ
Daily · Perplexity · Perplexity

Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные

Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…

1 мин
06 МАЯ
Daily · Google · Google

Gemini Interactions API ломается второй раз за полгода — и снова срочно

Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …

3 мин
01 МАЯ
Daily · Tencent · Tencent Hunyuan

Pixal3D-D от Tencent: 3D-модель представлена без документации

Tencent ARC Lab представила Pixal3D-D — новую модель для 3D-генерации, которая появилась на Hugging Face. Однако, несмотря на релиз, публичной документации или детального описания, как это часто бывает, пока нет.

1 мин
01 МАЯ
Daily · HuggingFace · HuggingFace

Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации

HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…

3 мин
29 АПР
Daily · fal · fal

Fal: централизованная аналитика для Serverless-приложений

Fal представил новую панель мониторинга для Serverless-приложений, которая агрегирует метрики производительности, трафика и активности. Это позволяет инженерам, работающим с Fal, получить единую картину состояния своих…

2 мин
27 АПР
Daily · Perplexity · Perplexity

Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models

Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…

2 мин
24 АПР
Daily · DeepSeek · DeepSeek

DeepSeek: V4-модели с контекстом 1M токенов и деприкация старых API

DeepSeek обновил свой API, представив новое поколение моделей с увеличенным контекстом и объявив о скором прекращении поддержки старых версий. Разработчикам, использующим DeepSeek, предстоит запланировать миграцию.

1 мин
23 АПР
Daily · Tencent · Tencent Hunyuan

**Формат координат и ответа:**

Точка: (x, y) или [(x1, y1), (x2, y2)] Коробка: [xmin, ymin, xmax, ymax] Координаты нормализованы до целочисленного диапазона (0, 1000). В режиме thinking mode ответы структурированы как…

1 мин
22 АПР
Daily · Google · Google

Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM

Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…

3 мин
22 АПР
Daily · DeepSeek · DeepSeek

DeepSeek-V4: Контекст в 1M токенов и гибридная архитектура внимания

DeepSeek AI представила новую серию моделей DeepSeek-V4, включая DeepSeek-V4-Pro и DeepSeek-V4-Flash. Главная особенность обеих версий — поддержка контекстного окна в один миллион токенов, что переводит их в лигу…

3 мин
21 АПР
Daily · Replicate · Replicate

Agent skills для Replicate: учим ассистентов работать с моделями как про

Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…

2 мин
15 АПР
Daily · Replicate · Replicate

**Разработчики предлагают несколько советов для получения наилучшего результата:**

Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…

4 мин
15 АПР
Daily · Google · Google

Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос

Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…

2 мин
14 АПР
Daily · Google · Google

Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы

Google расширяет свою AI-инфраструктуру, предлагая как новые возможности для сторонних моделей, так и улучшения для собственных. На этой неделе стал доступен Claude Opus 4.7 в Vertex AI Model Garden, предоставляя…

2 мин
13 АПР
Daily · Perplexity · Perplexity

Agent API Perplexity: новые модели и прощание со старыми Gemini

Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…

2 мин
10 АПР
Daily · fal · fal

PATINA: Fal генерирует PBR-карты из изображений для CGI, минуя «запеченные» проблемы

AI-модели показывают впечатляющие результаты в генерации изображений, имитирующих различные материалы — от камня до металла. Однако эти изображения зачастую непригодны для традиционных 3D-рабочих процессов из-за…

4 мин
06 АПР
Daily · Black Forest Labs · Black Forest Labs

AI-новости

Обратите внимание на pipe.enable_model_cpu_offload() — эта строка кода демонстрирует типичную технику для дальнейшей оптимизации использования VRAM, перемещая части модели в CPU по мере необходимости.

3 мин
02 АПР
Daily · Google · Google

Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5

Google выпустил Gemma 4 — открытые модели под Apache 2.0: 3-е и 6-е места среди всех open-моделей мира, обходят те, что в 20 раз крупнее, запускаются хоть на телефоне, хоть на одной видеокарте. А в том же окне тихо…

4 мин