live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
10 ИЮН
Daily · Deepgram · Deepgram · TG #492

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.

1 мин
10 ИЮН
Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин
09 ИЮН
Daily · Luma AI · Luma AI · TG #480

Ray3.2 от Luma: покадровое управление видео и первый полноценный API

До 16 кейфреймов в одном клипе и 16-bit EXR на выходе — впервые всё это доступно через API; 5 секунд в 1080p стоят $1.20.

2 мин
09 ИЮН
Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин
04 ИЮН
Daily · Black Forest Labs · Black Forest Labs · TG #446

FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки

Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.

1 мин
03 ИЮН
Daily · Luma AI · Luma AI · TG #437

Luma Ray3.14 заменил захват движений на живом выступлении в Париже

Модель в 4 раза быстрее и в 3 раза дешевле предшественника — теперь в руках независимых авторов.

1 мин
01 ИЮН
Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

1 мин
01 ИЮН
Daily · Luma AI · Luma AI

Luma открывает Physical AI Lab: ставка на открытую науку против монополии в робототехнике

Luma объявила об Open Physical AI Lab — исследовательской инициативе с открытым доступом, нацеленной на проблему обобщения в физическом ИИ. Компания считает её главным барьером между нынешними роботами и системами…

1 мин
29 МАЯ
Daily · Deepgram · Deepgram

Nova-3 Medical: точность в медицине растет, но что с остальным?

Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.

6 мин
28 МАЯ
Daily · Black Forest Labs · Black Forest Labs

FLUX VTO: виртуальная примерка в масштабе каталога

Black Forest Labs анонсировала FLUX VTO — новую технологию виртуальной примерки одежды, предназначенную для ритейлеров, которая обеспечивает высокую скорость, точность рендеринга и гибкость стилизации для больших…

7 мин
28 МАЯ
Daily · Deepgram · Deepgram · TG #336

Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским

Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.

6 мин
28 МАЯ
Daily · Google · Google

Gemini Image Models: видео в картинку, но не для всех

Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.

7 мин
27 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать

Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.

6 мин
26 МАЯ
Daily · Google · Google

Vertex AI Extensions уходят: Google переводит фокус на Agent Platform

Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.

7 мин
21 МАЯ
Daily · Google · Google

Google DeepMind Accelerator: AI против климатических рисков в АТР

Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…

2 мин
19 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать

Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…

1 мин
14 МАЯ
Daily · Deepgram · Deepgram

Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках

Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…

4 мин
14 МАЯ
Daily · Black Forest Labs · Black Forest Labs

FLUX Outpainting: ИИ-расширение изображений в один API-вызов, без промтов

Black Forest Labs представила новую возможность для своей линейки FLUX Tools — FLUX Outpainting. Инструмент позволяет расширять любое изображение за его исходные границы, автоматически сохраняя при этом целостность…

3 мин
06 МАЯ
Daily · Google · Google

Gemini Interactions API ломается второй раз за полгода — и снова срочно

Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …

3 мин
05 МАЯ
Daily · Luma AI · Luma AI

uni-1-1-api: Luma AI запускает управляемый интеллект для продакшена

Luma AI представила uni-1-1-api, REST-интерфейс к своей модели унифицированного интеллекта, который обещает изменить подходы к генерации и редактированию изображений, выводя эти процессы на новый уровень управляемости и…

5 мин
29 АПР
Daily · Deepgram · Deepgram

Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности

Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…

6 мин
22 АПР
Daily · Google · Google

Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM

Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…

3 мин
16 АПР
Daily · Luma AI · Luma AI

Luma AI: гибридное кинопроизводство с ИИ приходит в Голливуд

Luma AI, в партнерстве с Wonder Project и при поддержке AWS, запускает Innovative Dreams — новую производственную компанию, которая интегрирует генеративный ИИ в традиционное кинопроизводство. Цель — преодолеть…

3 мин
15 АПР
Daily · Luma AI · Luma AI

Luma Agents: рекламный ролик Mazda сдан за две недели вместо месяцев — что это меняет?

Luma Agents показали себя в работе над первым рекламным роликом Mazda, полностью созданным с помощью искусственного интеллекта. Кейс южноафриканского агентства Boundless демонстрирует, как новые рабочие процессы могут…

2 мин
15 АПР
Daily · Google · Google

Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос

Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…

2 мин
14 АПР
Daily · Google · Google

Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы

Google расширяет свою AI-инфраструктуру, предлагая как новые возможности для сторонних моделей, так и улучшения для собственных. На этой неделе стал доступен Claude Opus 4.7 в Vertex AI Model Garden, предоставляя…

2 мин
06 АПР
Daily · Black Forest Labs · Black Forest Labs

AI-новости

Обратите внимание на pipe.enable_model_cpu_offload() — эта строка кода демонстрирует типичную технику для дальнейшей оптимизации использования VRAM, перемещая части модели в CPU по мере необходимости.

3 мин
02 АПР
Daily · Google · Google

Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5

Google выпустил Gemma 4 — открытые модели под Apache 2.0: 3-е и 6-е места среди всех open-моделей мира, обходят те, что в 20 раз крупнее, запускаются хоть на телефоне, хоть на одной видеокарте. А в том же окне тихо…

4 мин
25 МАР
Daily · Google · Google

Lyria 3 Pro: песня целиком — но имитировать артиста модель отказывается

Google выпустил Lyria 3 Pro — модель генерации музыки: уже не 30-секундная петля, а трек до трёх минут с заданной структурой (интро/куплет/припев/бридж по запросу). Но Google намеренно сделал так, что имитировать…

3 мин
03 МАР
Daily · Black Forest Labs · Black Forest Labs

FLUX.2 [pro]: удвоение скорости без изменения API

Black Forest Labs представила ускорение своей флагманской модели FLUX.2 [pro] для генерации и редактирования изображений. Заявлено двукратное увеличение производительности без компромиссов в качестве и без повышения…

5 мин