Новости AI-стека
Daily · свежие материалы
Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов
Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.
nn.Linear под профилировщиком: transpose не трогает GPU
Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.
Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним
Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке
Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.
Hugging Face Spaces стали API-блоками для агентов — 3D-галерея Парижа без единой строки интеграции
Файл agents.md отдаёт схему, эндпоинты и инструкцию по загрузке файлов одним curl — агент читает и сразу вызывает Space.
OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление
Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.
Her читает JSONL-логи Claude Code и находит рискованные действия агента
Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.
Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU
Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.
Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри
100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.
DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок
Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.
Veo 3.1 на Runway перестал генерировать видео
Движок принадлежит Google — Runway только ждёт, пока там починят.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes
В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.
Runway расследует повышенный уровень ошибок в Seedance и Seedream
Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.
Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам
Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
Holo3.1: computer-use агент теперь работает локально и на мобильных
Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…
Runway вложит $100 млн в лондонский хаб по world models
$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…
Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков
JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.
Gemini 2.0 Flash отключён — что ставить вместо него
1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…
Recraft V4.1 Utility Pro стал самым высокорейтинговым моделью text-to-image за пределами Google и OpenAI
Recraft V4.1 Utility Pro заняла третье место в глобальном рейтинге Artificial Analysis Image Arena, став самой высокорейтинговой моделью text-to-image от независимой лаборатории.
Выпущен smolagents v1.26.0
В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.
happyhorse: генерация видео с контролем длительности и формата
HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
BytePlus в магическом квадранте Gartner: позиция среди ИИ-агентов кодирования
Облачное подразделение ByteDance вошло в первый магический квадрант Gartner 2025 года для корпоративных ИИ-агентов кодирования, что подчеркивает растущую конкуренцию на этом рынке.
Seedance 2.0 теперь доступен через API Runway
Модель Seedance 2.0, разработанная сторонней командой, теперь доступна через API Runway, предлагая расширенные функции для генерации видео из различных типов данных.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI
Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.