Новости AI-стека
Daily · свежие материалы
Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов
Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.
nn.Linear под профилировщиком: transpose не трогает GPU
Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.
Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним
Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.
Цифра «80% работников под угрозой ИИ» устарела — Cohere Labs объясняет почему
Один показатель из 2023 года правит дискуссией в парламентах — хотя три его ограничения накапливаются, а не просто суммируются.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
Cohere выпустила North Mini Code — первую открытую модель для кода под Apache 2.0
Маленькая, бесплатная и работает локально — намеренный разворот от корпоративного закрытого AI.
Hugging Face Spaces стали API-блоками для агентов — 3D-галерея Парижа без единой строки интеграции
Файл agents.md отдаёт схему, эндпоинты и инструкцию по загрузке файлов одним curl — агент читает и сразу вызывает Space.
North-Mini-Code-1.0 от Cohere запускается на локальном железе — без облака
30B параметров суммарно, но в работе — только 3B; Apache 2.0, контекст 256K.
Cohere открыла Tiny Aya и Transcribe — модели до 3.3B, работающие без облака
Transcribe в 3× быстрее аналогов по пропускной способности и занял первое место на Open ASR Leaderboard по английскому.
OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление
Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.
Her читает JSONL-логи Claude Code и находит рискованные действия агента
Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.
Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU
Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.
Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри
100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.
DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок
Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.
Veo 3.1 на Runway перестал генерировать видео
Движок принадлежит Google — Runway только ждёт, пока там починят.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
Cohere Labs открыла бесплатный инструмент для построения графиков
Co/plot позволяет быстро менять и уточнять графики без перезапуска скриптов и ручной перерисовки данных.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes
В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.
Cerebras Inference лёг из-за сбоя биллинга AWS
Проблема была не в чипах — в платёжной интеграции с Amazon.
Runway расследует повышенный уровень ошибок в Seedance и Seedream
Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.
Cohere Labs запускает бенчмарк культурных загадок и ищет экспертов со всего мира
Параллельно — дискуссия о том, нужен ли агентам «язык чувств» для координации.
Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам
Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
Holo3.1: computer-use агент теперь работает локально и на мобильных
Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…
Runway вложит $100 млн в лондонский хаб по world models
$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…
Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков
JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.
StepFun Step 3.5/3.7 Flash появились на выделенных эндпоинтах Cerebras
Cerebras открыл dedicated endpoints для Step 3.5 Flash и Step 3.7 Flash от StepFun. Enterprise-клиенты получают изолированную инфраструктуру под MoE-модели — и это не просто удобство, а принципиальный сдвиг для…
Cohere Labs идёт на хакатон Hugging Face со своими малыми моделями
Cohere Labs поддержала хакатон «Build. Small.» от Hugging Face и Gradio, назвав Tiny Aya и Cohere Transcribe рекомендованными моделями для участников. Это первое явное позиционирование компании в нише компактных моделей…
Выпущен smolagents v1.26.0
В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.