Новости AI-стека
Daily · свежие материалы
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
Ray3.2 от Luma: покадровое управление видео и первый полноценный API
До 16 кейфреймов в одном клипе и 16-bit EXR на выходе — впервые всё это доступно через API; 5 секунд в 1080p стоят $1.20.
Luma Ray3.14 заменил захват движений на живом выступлении в Париже
Модель в 4 раза быстрее и в 3 раза дешевле предшественника — теперь в руках независимых авторов.
Luma открывает Physical AI Lab: ставка на открытую науку против монополии в робототехнике
Luma объявила об Open Physical AI Lab — исследовательской инициативе с открытым доступом, нацеленной на проблему обобщения в физическом ИИ. Компания считает её главным барьером между нынешними роботами и системами…
Nova-3 Medical: точность в медицине растет, но что с остальным?
Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.
Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским
Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.
Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать
Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.
Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать
Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…
Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках
Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
uni-1-1-api: Luma AI запускает управляемый интеллект для продакшена
Luma AI представила uni-1-1-api, REST-интерфейс к своей модели унифицированного интеллекта, который обещает изменить подходы к генерации и редактированию изображений, выводя эти процессы на новый уровень управляемости и…
Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности
Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Kling AI: Первое нативное 4K видео от ИИ — что это значит для продакшена?
Модель Kling AI от Kuaishou теперь предлагает нативный вывод видео в разрешении 4K. Это позиционирует её как первую в мире модель искусственного интеллекта, способную генерировать видео в таком высоком разрешении, что…
Luma AI: гибридное кинопроизводство с ИИ приходит в Голливуд
Luma AI, в партнерстве с Wonder Project и при поддержке AWS, запускает Innovative Dreams — новую производственную компанию, которая интегрирует генеративный ИИ в традиционное кинопроизводство. Цель — преодолеть…
Luma Agents: рекламный ролик Mazda сдан за две недели вместо месяцев — что это меняет?
Luma Agents показали себя в работе над первым рекламным роликом Mazda, полностью созданным с помощью искусственного интеллекта. Кейс южноафриканского агентства Boundless демонстрирует, как новые рабочие процессы могут…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
Kling AI: совместная работа — теперь с настольным приложением
Kuaishou добавляет в свой инструмент для создания контента Kling AI функции для командной работы. Теперь инженеры и креативщики смогут быстрее обмениваться активами и эффективнее управлять проектами благодаря новым…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Kling VIDEO 3.0: Новый контроль движения для захвата
Kuaishou представила новую итерацию своего инструмента для создания видео, Kling VIDEO 3.0. Обновление фокусируется на улучшении фундаментальных механик, которые позволяют создавать более детализированные и…
Kling 3.0: Кинематографический сторителлинг в 4K и сериях изображений
Kuaishou объявила о полном развертывании своей модели Kling 3.0, которая позиционируется как новый стандарт в области AI-сторителлинга. Релиз сфокусирован на расширении возможностей визуального повествования, особенно…
Ray3.14: 1080p, быстрее и дешевле — но без референсов персонажей
Luma AI представила новую модель для генерации видео, Ray3.14, которая обещает существенные улучшения для работы с Dream Machine. Теперь генерация возможна в нативном 1080p, что само по себе делает модель более…