Новости AI-стека
Daily · свежие материалы
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Nova-3 Medical: точность в медицине растет, но что с остальным?
Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Фильтрация IP-адресов для корпоративных планов OpenRouter
OpenRouter добавила возможность ограничить использование API-ключей утвержденными IP-диапазонами, повышая безопасность для организаций.
Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI
Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.
Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским
Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.
Gemini Image Models: видео в картинку, но не для всех
Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.
OpenRouter: Claude Opus 4.8 уже здесь, а платформа получила $113M и новый API
Платформа OpenRouter значительно расширила свои предложения, добавив модели Claude Opus 4.8 и Opus 4.8 Fast, а также привлекла $113 млн в рамках раунда финансирования Серии B.
Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать
Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.
Hugging Face: Синхронизация дельта-весов в TRL сокращает передачу данных с терабайта до мегабайт
Hugging Face представила новую функцию в библиотеке TRL, значительно уменьшающую объем данных для синхронизации весов в асинхронном обучении с подкреплением.
OpenRouter: детализация моделей, умный маршрутизатор и строгие IP-списки
OpenRouter представил обновления, включающие улучшенные инструменты выбора моделей, гибкую автоматическую маршрутизацию с контролем стоимости и усиление безопасности IP-адресов.
Vertex AI Extensions уходят: Google переводит фокус на Agent Platform
Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.
Hugging Face Hub: Важный Hotfix устраняет проблемы с typer
Изменения в библиотеке Typer версии 0.26.0 привели к критическим сбоям в работе командной строки Hugging Face Hub, что потребовало незамедлительного выпуска исправления v1.16.3.
OpenRouter: логи, ключи API и видеоошибки теперь в одном клике
Обновления от 25 мая 2026 года упрощают навигацию по логам, доступ к деталям API-ключей и диагностику ошибок видеогенерации.
Hugging Face: наводим порядок в терминологии AI-агентов
Hugging Face предлагает стандартизированный глоссарий для устранения путаницы в ключевых понятиях AI-агентов, обеспечивая общее понимание в быстроразвивающейся области.
Специализированные модели: 3B-решения опережают флагманы по всем фронтам
Последние три года в AI-стратегии компаний доминировала простая логика: чем крупнее фронтир-модель, тем безопаснее. Считалось, что возможности масштабируются с числом параметров, а лидеры бенчмарков неизменно предлагают…
DeepSeek-V4-Pro: дисконт, ставший бессрочным
DeepSeek объявила, что скидка на использование модели DeepSeek-V4-Pro теперь действует постоянно. Это не временная акция, а фундаментальное изменение в ценовой политике, позволяющее разработчикам с большей уверенностью…
Qwen3.7 Max: миллион токенов на OpenRouter и новый взгляд на API-ключи
OpenRouter обновил свою платформу, добавив поддержку модели Qwen3.7 Max от Qwen, известной своим большим контекстным окном. Одновременно с этим, пользователи получили расширенные возможности по управлению историей чатов…
Google DeepMind Accelerator: AI против климатических рисков в АТР
Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…
Transformers 5.9.0: новые модели и меняющийся интерфейс эмбеддингов
HuggingFace выпустил библиотеку Transformers v5.9.0, добавив три новые модели и внеся важные изменения в обработку текстовых эмбеддингов для ряда моделей компьютерного зрения. Это обновление включает как новые…
Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать
Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…
Ettin Reranker: как пересортировать поиск без лишних затрат
Hugging Face представил семейство моделей Ettin Reranker. Это не просто очередной набор инструментов для ранжирования; они спроектированы, чтобы точно переупорядочивать результаты поиска, при этом удерживая контроль над…
Fal: Безопасность на скорости мысли — подход к доверию в AI
Fal, как поставщик инфраструктуры для искусственного интеллекта, активно выстраивает свою стратегию доверия и безопасности. Шон Бонавиц, руководитель этого направления в компании, делится философией и конкретными шагами…
Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках
Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…
StereoCrafter2: Tencent ARC Lab обновила модель для иммерсивного видео
Tencent ARC Lab выпустила обновление своей модели StereoCrafter, получившее название StereoCrafter2. Новая версия нацелена на решение ключевой проблемы в производстве иммерсивного видео: достижение высокой точности и…
Hy-MT2: многоязычный перевод для сложных сценариев — с оптимизацией для устройств
Tencent Hunyuan выпустила семейство многоязычных моделей перевода Hy-MT2, разработанных для сложных реальных сценариев. Модели доступны в размерах 1.8B, 7B и 30B-A3B (MoE), поддерживают 33 языка и демонстрируют…
OpenRouter: Агенты с человеческим участием и модель Ring-2.6-1T
Сложные задачи часто требуют человеческого суждения, но рутина должна автоматизироваться. Как найти этот баланс в работе AI-агентов? OpenRouter представляет новый тип инструментов для своего Agent SDK, который позволяет…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
uni-1-1-api: Luma AI запускает управляемый интеллект для продакшена
Luma AI представила uni-1-1-api, REST-интерфейс к своей модели унифицированного интеллекта, который обещает изменить подходы к генерации и редактированию изображений, выводя эти процессы на новый уровень управляемости и…