live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
10 ИЮН
Daily · Deepgram · Deepgram · TG #492

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.

1 мин
04 ИЮН
Daily · Black Forest Labs · Black Forest Labs · TG #446

FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки

Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.

1 мин
02 ИЮН
Daily · Together AI · Together AI

Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput

Together AI раскрыла инженерные решения, позволившие обслуживать MiniMax M3 (1M токенов, нативная мультимодальность, MSA-архитектура) с приростом throughput 81–125% на разных уровнях конкурентности. Это первый публичный…

2 мин
29 МАЯ
Daily · Together AI · Together AI

Together AI: как построить рекордно быстрый Speech-to-Text стек

Together AI представила детальное техническое описание оптимизации всего стека преобразования речи в текст, включая GPU, CPU, память и сетевые протоколы, установив новый мировой рекорд скорости.

8 мин
29 МАЯ
Daily · Deepgram · Deepgram

Nova-3 Medical: точность в медицине растет, но что с остальным?

Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.

6 мин
28 МАЯ
Daily · Black Forest Labs · Black Forest Labs

FLUX VTO: виртуальная примерка в масштабе каталога

Black Forest Labs анонсировала FLUX VTO — новую технологию виртуальной примерки одежды, предназначенную для ритейлеров, которая обеспечивает высокую скорость, точность рендеринга и гибкость стилизации для больших…

7 мин
28 МАЯ
Daily · Deepgram · Deepgram · TG #336

Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским

Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.

6 мин
27 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать

Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.

6 мин
22 МАЯ
Daily · DeepSeek · X · DeepSeek

DeepSeek-V4-Pro: дисконт, ставший бессрочным

DeepSeek объявила, что скидка на использование модели DeepSeek-V4-Pro теперь действует постоянно. Это не временная акция, а фундаментальное изменение в ценовой политике, позволяющее разработчикам с большей уверенностью…

1 мин
19 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать

Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…

1 мин
15 МАЯ
Daily · Together AI · Together AI

Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI

Together AI объединяет усилия с Pearl Research Labs, чтобы радикально изменить экономику инференса AI. В основе нового партнёрства лежит технология Proof of Useful Work, которая позволяет одновременно с вычислениями для…

3 мин
14 МАЯ
Daily · Together AI · Together AI

violin: Открытый AI-перевод видео, который уважает голоса

Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…

3 мин
14 МАЯ
Daily · Deepgram · Deepgram

Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках

Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…

4 мин
14 МАЯ
Daily · Black Forest Labs · Black Forest Labs

FLUX Outpainting: ИИ-расширение изображений в один API-вызов, без промтов

Black Forest Labs представила новую возможность для своей линейки FLUX Tools — FLUX Outpainting. Инструмент позволяет расширять любое изображение за его исходные границы, автоматически сохраняя при этом целостность…

3 мин
12 МАЯ
Daily · Together AI · Together AI

Voice Finder от Together AI: 600 голосов теперь можно искать по запросу

Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…

10 мин
06 МАЯ
Daily · Perplexity · Perplexity

Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные

Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…

1 мин
29 АПР
Daily · Deepgram · Deepgram

Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности

Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…

6 мин
27 АПР
Daily · Perplexity · Perplexity

Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models

Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…

2 мин
24 АПР
Daily · DeepSeek · DeepSeek

DeepSeek: V4-модели с контекстом 1M токенов и деприкация старых API

DeepSeek обновил свой API, представив новое поколение моделей с увеличенным контекстом и объявив о скором прекращении поддержки старых версий. Разработчикам, использующим DeepSeek, предстоит запланировать миграцию.

1 мин
22 АПР
Daily · DeepSeek · DeepSeek

DeepSeek-V4: Контекст в 1M токенов и гибридная архитектура внимания

DeepSeek AI представила новую серию моделей DeepSeek-V4, включая DeepSeek-V4-Pro и DeepSeek-V4-Flash. Главная особенность обеих версий — поддержка контекстного окна в один миллион токенов, что переводит их в лигу…

3 мин
13 АПР
Daily · Perplexity · Perplexity

Agent API Perplexity: новые модели и прощание со старыми Gemini

Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…

2 мин
06 АПР
Daily · Black Forest Labs · Black Forest Labs

AI-новости

Обратите внимание на pipe.enable_model_cpu_offload() — эта строка кода демонстрирует типичную технику для дальнейшей оптимизации использования VRAM, перемещая части модели в CPU по мере необходимости.

3 мин
04 МАР
Daily · Perplexity · Perplexity

Perplexity: Агенты и вложения — теперь в релизе для продакшена

Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…

1 мин
03 МАР
Daily · Black Forest Labs · Black Forest Labs

FLUX.2 [pro]: удвоение скорости без изменения API

Black Forest Labs представила ускорение своей флагманской модели FLUX.2 [pro] для генерации и редактирования изображений. Заявлено двукратное увеличение производительности без компромиссов в качестве и без повышения…

5 мин
01 ДЕК
Daily · DeepSeek · DeepSeek

DeepSeek-V3.2: Две модели и временный чемпион по рассуждению

Необычный шаг от DeepSeek: наряду с регулярным обновлением до версии deepseek-v3-2, компания выпустила крайне производительную, но временную модель deepseek-v3-2-speciale. Это создает интересную дилемму для…

2 мин
29 СЕН
Daily · DeepSeek · DeepSeek

DeepSeek-V3.2-Exp: разреженное внимание ускоряет длинный контекст и снижает цены

Когда провайдеры моделей радикально меняют архитектуру, это обычно означает одно из двух: либо решаются фундаментальные проблемы производительности, либо открываются новые возможности для разработчиков. В случае с…

2 мин
22 СЕН
Daily · DeepSeek · DeepSeek

DeepSeek-V3.1-Terminus: фокус на консистентность и агентов

Гибридные модели, совмещающие разные языки, часто привносят неожиданные артефакты в выводе. DeepSeek выпустил обновление V3.1-Terminus для своих моделей deepseek-chat и deepseek-reasoner, заявленная цель которого — не…

2 мин
21 АВГ
Daily · DeepSeek · DeepSeek

DeepSeek-V3.1: Гибридная архитектура объединяет мысль и скорость

DeepSeek выпустил новую модель deepseek-v3-1, которая стирает границу между режимами «думающий» (thinking) и «недумающий» (non-thinking). Теперь эти два подхода объединены в единую гибридную архитектуру, что должно…

2 мин
28 МАЯ
Daily · DeepSeek · DeepSeek

DeepSeek-R1-0528: Новые возможности рассуждения и функции

На рынке LLM, где каждый новый релиз обещает "лучшую логику", DeepSeek делает конкретный шаг с обновлением своей модели deepseek-reasoner до версии deepseek-r1-0528. Этот релиз не просто заявляет об улучшениях, но и…

2 мин
20 ЯНВ
Daily · DeepSeek · DeepSeek

DeepSeek-R1: Новое поколение моделей рассуждений и открытый исходный код

Когда речь заходит о больших языковых моделях, производительность в задачах рассуждений (reasoning), математики и кодирования часто становится главным камнем преткновения. Как добиться паритета с лидерами рынка…

4 мин