live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
12 ИЮН
Daily · HuggingFace · HuggingFace · TG #504

Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов

Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.

1 мин
11 ИЮН
Daily · HuggingFace · HuggingFace · TG #500

nn.Linear под профилировщиком: transpose не трогает GPU

Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.

1 мин
10 ИЮН
Daily · Cohere · X · Cohere · TG #496

Цифра «80% работников под угрозой ИИ» устарела — Cohere Labs объясняет почему

Один показатель из 2023 года правит дискуссией в парламентах — хотя три его ограничения накапливаются, а не просто суммируются.

2 мин
10 ИЮН
Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин
09 ИЮН
Daily · Cohere · X · Cohere · TG #484

Cohere выпустила North Mini Code — первую открытую модель для кода под Apache 2.0

Маленькая, бесплатная и работает локально — намеренный разворот от корпоративного закрытого AI.

1 мин
09 ИЮН
Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин
09 ИЮН
Daily · HuggingFace · HuggingFace · TG #476

Hugging Face Spaces стали API-блоками для агентов — 3D-галерея Парижа без единой строки интеграции

Файл agents.md отдаёт схему, эндпоинты и инструкцию по загрузке файлов одним curl — агент читает и сразу вызывает Space.

1 мин
09 ИЮН
Daily · Cohere · Cohere · TG #472

North-Mini-Code-1.0 от Cohere запускается на локальном железе — без облака

30B параметров суммарно, но в работе — только 3B; Apache 2.0, контекст 256K.

1 мин
08 ИЮН
Daily · Cohere · X · Cohere · TG #474

Cohere открыла Tiny Aya и Transcribe — модели до 3.3B, работающие без облака

Transcribe в 3× быстрее аналогов по пропускной способности и занял первое место на Open ASR Leaderboard по английскому.

2 мин
08 ИЮН
Daily · HuggingFace · HuggingFace · TG #466

OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление

Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.

2 мин
08 ИЮН
Daily · Alibaba · Alibaba · TG #465

Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле

Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.

2 мин
07 ИЮН
Daily · HuggingFace · HuggingFace · TG #463

Her читает JSONL-логи Claude Code и находит рискованные действия агента

Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.

1 мин
06 ИЮН
Daily · HuggingFace · HuggingFace · TG #459

Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU

Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.

1 мин
05 ИЮН
Daily · HuggingFace · HuggingFace · TG #457

Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри

100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.

2 мин
04 ИЮН
Daily · Tencent · Tencent Hunyuan · TG #450

Sculpt4D от Tencent ARC генерирует 4D-объекты из видео — на 56% дешевле полного внимания

Модель надстроена над Hunyuan3D 2.1 и уже открыта на Hugging Face — но время инференса и лицензия не раскрыты.

1 мин
04 ИЮН
Daily · HuggingFace · HuggingFace · TG #449

DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок

Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.

2 мин
04 ИЮН
Daily · Black Forest Labs · Black Forest Labs · TG #446

FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки

Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.

1 мин
03 ИЮН
Daily · Cohere · X · Cohere · TG #443

Cohere Labs открыла бесплатный инструмент для построения графиков

Co/plot позволяет быстро менять и уточнять графики без перезапуска скриптов и ручной перерисовки данных.

1 мин
03 ИЮН
Daily · Stability AI · Stability AI · TG #441

Stability AI нашла способ экономить память при длинных текстах и видео

Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.

1 мин
03 ИЮН
Daily · HuggingFace · HuggingFace · TG #436

Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes

В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.

1 мин
03 ИЮН
Daily · Alibaba · Alibaba

Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди

100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.

2 мин
02 ИЮН
Daily · Cohere · X · Cohere

Cohere Labs запускает бенчмарк культурных загадок и ищет экспертов со всего мира

Параллельно — дискуссия о том, нужен ли агентам «язык чувств» для координации.

1 мин
02 ИЮН
Daily · Together AI · Together AI

Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput

Together AI раскрыла инженерные решения, позволившие обслуживать MiniMax M3 (1M токенов, нативная мультимодальность, MSA-архитектура) с приростом throughput 81–125% на разных уровнях конкурентности. Это первый публичный…

2 мин
02 ИЮН
Daily · HuggingFace · HuggingFace

Holo3.1: computer-use агент теперь работает локально и на мобильных

Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…

1 мин
01 ИЮН
Daily · HuggingFace · HuggingFace

Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков

JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.

1 мин
01 ИЮН
Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

1 мин
01 ИЮН
Daily · Alibaba · Alibaba

Quick BI против галлюцинирующих агентов: почему данные важнее модели

На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…

2 мин
01 ИЮН
Daily · Cohere · X · Cohere

Cohere Labs идёт на хакатон Hugging Face со своими малыми моделями

Cohere Labs поддержала хакатон «Build. Small.» от Hugging Face и Gradio, назвав Tiny Aya и Cohere Transcribe рекомендованными моделями для участников. Это первое явное позиционирование компании в нише компактных моделей…

1 мин
30 МАЯ
Daily · Recraft · Recraft

Recraft V4.1 Utility Pro стал самым высокорейтинговым моделью text-to-image за пределами Google и OpenAI

Recraft V4.1 Utility Pro заняла третье место в глобальном рейтинге Artificial Analysis Image Arena, став самой высокорейтинговой моделью text-to-image от независимой лаборатории.

5 мин
29 МАЯ
Daily · HuggingFace · HuggingFace

Выпущен smolagents v1.26.0

В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.

5 мин