live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
10 ИЮН
Daily · Deepgram · Deepgram · TG #492

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.

1 мин
03 ИЮН
Daily · Stability AI · Stability AI · TG #441

Stability AI нашла способ экономить память при длинных текстах и видео

Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.

1 мин
03 ИЮН
Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

1 мин
02 ИЮН
Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

1 мин
29 МАЯ
Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин
29 МАЯ
Daily · Deepgram · Deepgram

Nova-3 Medical: точность в медицине растет, но что с остальным?

Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.

6 мин
28 МАЯ
Daily · Replicate · Replicate

Снижение производительности flux-2-klein-4b

Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.

1 мин
28 МАЯ
Daily · Deepgram · Deepgram · TG #336

Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским

Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.

6 мин
27 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать

Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.

6 мин
19 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать

Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…

1 мин
18 МАЯ
Daily · Stability AI · Stability AI

Stable Audio 3: открытая модель для музыки и звуков с инпейнтингом

Stability AI выпустила Stable Audio 3 — новую открытую модель для генерации и редактирования аудио. Эта модель представляет собой семейство быстрых латентных диффузионных моделей, способных создавать аудио переменной…

3 мин
17 МАЯ
Daily · Stability AI · Stability AI

Stability AI: Как новый автоэнкодер SAME ускоряет генерацию аудио в Stable Audio 3

Stability AI представила SAME (Semantically-Aligned Music Autoencoder) — открытый автоэнкодер, который призван изменить подходы к работе с музыкальными и общими аудиоданными. Его основная задача — эффективное сжатие…

3 мин
14 МАЯ
Daily · Deepgram · Deepgram

Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках

Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…

4 мин
06 МАЯ
Daily · Perplexity · Perplexity

Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные

Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…

1 мин
29 АПР
Daily · Deepgram · Deepgram

Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности

Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…

6 мин
27 АПР
Daily · Perplexity · Perplexity

Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models

Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…

2 мин
21 АПР
Daily · Replicate · Replicate

Agent skills для Replicate: учим ассистентов работать с моделями как про

Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…

2 мин
15 АПР
Daily · Replicate · Replicate

**Разработчики предлагают несколько советов для получения наилучшего результата:**

Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…

4 мин
13 АПР
Daily · Perplexity · Perplexity

Agent API Perplexity: новые модели и прощание со старыми Gemini

Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…

2 мин
26 МАР
Daily · Suno · Suno

Suno v5.5: модель учится вашему голосу и стилю

Suno выпустила версию модели v5.5, сделав акцент на персонализацию и выразительность. Основные нововведения — функции, которые позволяют пользователям захватывать и использовать собственный голос в генерации музыки…

2 мин
04 МАР
Daily · Perplexity · Perplexity

Perplexity: Агенты и вложения — теперь в релизе для продакшена

Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…

1 мин
02 МАР
Daily · Replicate · Replicate

Nano Banana Pro: обходит лимиты Google с резервной моделью

Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…

2 мин
06 ФЕВ
Daily · Suno · Suno

Suno Studio: больше контроля над музыкой без выхода из редактора

В мире, где AI-инструменты для создания музыки множатся, главная ставка — на контроль над результатом. Suno Studio, генеративная аудио рабочая станция, доступная подписчикам Suno Premier, сделала шаг именно в этом…

2 мин
25 НОЯ
Daily · Suno · Suno

Suno и Warner Music Group: лицензирование музыки ради «интерактивного будущего»

Сервис генерации музыки Suno объявил о заключении партнерства с Warner Music Group (WMG). Этот шаг означает, что Suno получит доступ к лицензированной музыке для обучения своих моделей, что, по заявлению компании…

2 мин
19 НОЯ
Daily · Stability AI · Stability AI

Stable Audio: Warner Music Group и Stability AI создадут этичный AI для музыки

Warner Music Group и Stability AI объявили о партнёрстве, цель которого — разработка нового поколения инструментов для создания музыки с использованием ответственного подхода к искусственному интеллекту. Этот союз…

2 мин
27 ОКТ
Daily · Stability AI · Stability AI

Foley Control: Звук в видео без переобучения тяжелых моделей

Stability AI представила foley-control, новый метод для генерации реалистичных звуковых эффектов (фоли) на основе видео. Подход позволяет добавлять синхронизированные звуки к видео без необходимости переобучать крупные…

2 мин