live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
12 ИЮН
Daily · HuggingFace · HuggingFace · TG #504

Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов

Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.

1 мин
11 ИЮН
Daily · HuggingFace · HuggingFace · TG #500

nn.Linear под профилировщиком: transpose не трогает GPU

Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.

1 мин
10 ИЮН
Daily · Deepgram · Deepgram · TG #492

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.

1 мин
09 ИЮН
Daily · HuggingFace · HuggingFace · TG #476

Hugging Face Spaces стали API-блоками для агентов — 3D-галерея Парижа без единой строки интеграции

Файл agents.md отдаёт схему, эндпоинты и инструкцию по загрузке файлов одним curl — агент читает и сразу вызывает Space.

1 мин
08 ИЮН
Daily · HuggingFace · HuggingFace · TG #466

OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление

Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.

2 мин
07 ИЮН
Daily · HuggingFace · HuggingFace · TG #463

Her читает JSONL-логи Claude Code и находит рискованные действия агента

Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.

1 мин
06 ИЮН
Daily · HuggingFace · HuggingFace · TG #459

Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU

Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.

1 мин
05 ИЮН
Daily · HuggingFace · HuggingFace · TG #457

Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри

100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.

2 мин
04 ИЮН
Daily · HuggingFace · HuggingFace · TG #449

DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок

Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.

2 мин
04 ИЮН
Daily · Black Forest Labs · Black Forest Labs · TG #446

FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки

Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.

1 мин
03 ИЮН
Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

1 мин
03 ИЮН
Daily · HuggingFace · HuggingFace · TG #436

Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes

В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.

1 мин
02 ИЮН
Daily · Together AI · Together AI

Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput

Together AI раскрыла инженерные решения, позволившие обслуживать MiniMax M3 (1M токенов, нативная мультимодальность, MSA-архитектура) с приростом throughput 81–125% на разных уровнях конкурентности. Это первый публичный…

2 мин
02 ИЮН
Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

1 мин
02 ИЮН
Daily · HuggingFace · HuggingFace

Holo3.1: computer-use агент теперь работает локально и на мобильных

Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…

1 мин
01 ИЮН
Daily · HuggingFace · HuggingFace

Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков

JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.

1 мин
29 МАЯ
Daily · HuggingFace · HuggingFace

Выпущен smolagents v1.26.0

В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.

5 мин
29 МАЯ
Daily · Together AI · Together AI

Together AI: как построить рекордно быстрый Speech-to-Text стек

Together AI представила детальное техническое описание оптимизации всего стека преобразования речи в текст, включая GPU, CPU, память и сетевые протоколы, установив новый мировой рекорд скорости.

8 мин
29 МАЯ
Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин
29 МАЯ
Daily · Deepgram · Deepgram

Nova-3 Medical: точность в медицине растет, но что с остальным?

Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.

6 мин
28 МАЯ
Daily · Replicate · Replicate

Снижение производительности flux-2-klein-4b

Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.

1 мин
28 МАЯ
Daily · HuggingFace · HuggingFace

Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI

Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.

8 мин
28 МАЯ
Daily · Black Forest Labs · Black Forest Labs

FLUX VTO: виртуальная примерка в масштабе каталога

Black Forest Labs анонсировала FLUX VTO — новую технологию виртуальной примерки одежды, предназначенную для ритейлеров, которая обеспечивает высокую скорость, точность рендеринга и гибкость стилизации для больших…

7 мин
28 МАЯ
Daily · Deepgram · Deepgram · TG #336

Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским

Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.

6 мин
27 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать

Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.

6 мин
27 МАЯ
Daily · HuggingFace · HuggingFace

Hugging Face: Синхронизация дельта-весов в TRL сокращает передачу данных с терабайта до мегабайт

Hugging Face представила новую функцию в библиотеке TRL, значительно уменьшающую объем данных для синхронизации весов в асинхронном обучении с подкреплением.

10 мин
26 МАЯ
Daily · HuggingFace · HuggingFace

Hugging Face Hub: Важный Hotfix устраняет проблемы с typer

Изменения в библиотеке Typer версии 0.26.0 привели к критическим сбоям в работе командной строки Hugging Face Hub, что потребовало незамедлительного выпуска исправления v1.16.3.

5 мин
25 МАЯ
Daily · HuggingFace · HuggingFace

Hugging Face: наводим порядок в терминологии AI-агентов

Hugging Face предлагает стандартизированный глоссарий для устранения путаницы в ключевых понятиях AI-агентов, обеспечивая общее понимание в быстроразвивающейся области.

9 мин
22 МАЯ
Daily · HuggingFace · HuggingFace

Специализированные модели: 3B-решения опережают флагманы по всем фронтам

Последние три года в AI-стратегии компаний доминировала простая логика: чем крупнее фронтир-модель, тем безопаснее. Считалось, что возможности масштабируются с числом параметров, а лидеры бенчмарков неизменно предлагают…

3 мин
20 МАЯ
Daily · HuggingFace · HuggingFace

Transformers 5.9.0: новые модели и меняющийся интерфейс эмбеддингов

HuggingFace выпустил библиотеку Transformers v5.9.0, добавив три новые модели и внеся важные изменения в обработку текстовых эмбеддингов для ряда моделей компьютерного зрения. Это обновление включает как новые…

3 мин