Новости AI-стека
Daily · свежие материалы
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
Cerebras Inference лёг из-за сбоя биллинга AWS
Проблема была не в чипах — в платёжной интеграции с Amazon.
StepFun Step 3.5/3.7 Flash появились на выделенных эндпоинтах Cerebras
Cerebras открыл dedicated endpoints для Step 3.5 Flash и Step 3.7 Flash от StepFun. Enterprise-клиенты получают изолированную инфраструктуру под MoE-модели — и это не просто удобство, а принципиальный сдвиг для…
Nova-3 Medical: точность в медицине растет, но что с остальным?
Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.
Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским
Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.
Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать
Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.
Cerebras: две модели уходят в запас, время миграции
Cerebras прекращает поддержку моделей llama3.1-8b и qwen-3-235b-a22b-instruct-2507 с 27 мая 2026 года, призывая пользователей к переходу на рекомендованные альтернативы.
Cerebras: суверенитет в ИИ — как его видит производитель вафельных чипов
Cerebras запускает глобальную инициативу “Cerebras for Nations” для поддержки стран в развитии собственного ИИ, обеспечивая контроль над инфраструктурой, моделями и данными.
Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать
Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…
Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках
Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Cerebras: инцидент с Qwen-моделью и 5-кратный прирост для coding-агентов Cognition
Cerebras сообщила об устранении инцидента с одной из своих моделей и сделала общедоступной важную функциональность для управления API-ключами. Параллельно компания представила результаты работы с Cognition, где их…
Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности
Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Cerebras: выделенные конечные точки теперь поддерживают GLM 5 и Kimi K2.6
Cerebras добавляет новые модели от Z.AI и Moonshot AI на свои выделенные конечные точки. Этот шаг призван предоставить инженерам больше гибкости и выбора для развертывания специфических языковых моделей…
Cerebras: ключ к кэшу промптов ускорит LLM-инференс, но две модели уйдут в отставку
Cerebras обновила свой API, добавив параметр prompt_cache_key, который позволяет управлять кэшированием промптов и сократить задержку до первого токена. Это небольшое, но важное изменение даёт инженерам больше контроля…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…