live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
10 ИЮН
Daily · Deepgram · Deepgram · TG #492

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.

1 мин
10 ИЮН
Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин
09 ИЮН
Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин
04 ИЮН
Daily · Black Forest Labs · Black Forest Labs · TG #446

FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки

Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.

1 мин
03 ИЮН
Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

1 мин
02 ИЮН
Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

1 мин
01 ИЮН
Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

1 мин
29 МАЯ
Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин
29 МАЯ
Daily · Deepgram · Deepgram

Nova-3 Medical: точность в медицине растет, но что с остальным?

Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.

6 мин
28 МАЯ
Daily · Replicate · Replicate

Снижение производительности flux-2-klein-4b

Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.

1 мин
28 МАЯ
Daily · Black Forest Labs · Black Forest Labs

FLUX VTO: виртуальная примерка в масштабе каталога

Black Forest Labs анонсировала FLUX VTO — новую технологию виртуальной примерки одежды, предназначенную для ритейлеров, которая обеспечивает высокую скорость, точность рендеринга и гибкость стилизации для больших…

7 мин
28 МАЯ
Daily · Deepgram · Deepgram · TG #336

Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским

Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.

6 мин
28 МАЯ
Daily · Google · Google

Gemini Image Models: видео в картинку, но не для всех

Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.

7 мин
27 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать

Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.

6 мин
26 МАЯ
Daily · Google · Google

Vertex AI Extensions уходят: Google переводит фокус на Agent Platform

Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.

7 мин
21 МАЯ
Daily · Google · Google

Google DeepMind Accelerator: AI против климатических рисков в АТР

Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…

2 мин
19 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать

Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…

1 мин
14 МАЯ
Daily · Deepgram · Deepgram

Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках

Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…

4 мин
14 МАЯ
Daily · Black Forest Labs · Black Forest Labs

FLUX Outpainting: ИИ-расширение изображений в один API-вызов, без промтов

Black Forest Labs представила новую возможность для своей линейки FLUX Tools — FLUX Outpainting. Инструмент позволяет расширять любое изображение за его исходные границы, автоматически сохраняя при этом целостность…

3 мин
06 МАЯ
Daily · Perplexity · Perplexity

Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные

Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…

1 мин
06 МАЯ
Daily · AssemblyAI · AssemblyAI

AssemblyAI: когда JSON самоисправляется, а голоса чётко делятся по словам

Работа с моделями в продакшене всегда подразумевает компромиссы: LLM могут «глючить» с JSON-форматом, а аудиомодели — неточно разделять голоса в потоке. На этой неделе AssemblyAI показала два обновления, которые решают…

2 мин
06 МАЯ
Daily · Google · Google

Gemini Interactions API ломается второй раз за полгода — и снова срочно

Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …

3 мин
29 АПР
Daily · AssemblyAI · AssemblyAI

Voice Agent API: «позвонилка» с LLM-мозгом в один WebSocket

AssemblyAI Voice Agent API — это единый конвейер для создания голосовых агентов, который умеет понимать речь, рассуждать на базе LLM и генерировать голос. Он упакован в один WebSocket и позволяет обойтись без сложной…

2 мин
29 АПР
Daily · Deepgram · Deepgram

Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности

Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…

6 мин
27 АПР
Daily · Perplexity · Perplexity

Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models

Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…

2 мин
25 АПР
Daily · AssemblyAI · AssemblyAI

PII Redaction: два транскрипта в одном запросе — удобно для UI, но не без подвоха

Соблюдение конфиденциальности данных и обеспечение полноты информации часто идут рука об руку с компромиссами. Например, когда PII Redaction скрывает персональные данные в транскриптах, это хорошо для безопасности, но…

2 мин
22 АПР
Daily · Google · Google

Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM

Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…

3 мин
21 АПР
Daily · Replicate · Replicate

Agent skills для Replicate: учим ассистентов работать с моделями как про

Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…

2 мин
19 АПР
Daily · AssemblyAI · AssemblyAI

Claude Opus 4.7 на LLM Gateway AssemblyAI: доступ к интеллекту Anthropic

AssemblyAI, известный своей платформой для работы с аудио, добавил поддержку новейшей модели Claude Opus 4.7 в свой LLM Gateway. Это значит, что инженеры теперь могут использовать одну из самых интеллектуальных моделей…

1 мин
15 АПР
Daily · Replicate · Replicate

**Разработчики предлагают несколько советов для получения наилучшего результата:**

Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…

4 мин