live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
12 ИЮН
Daily · OpenRouter · OpenRouter · TG #506

Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление

На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.

1 мин
12 ИЮН
Daily · HuggingFace · HuggingFace · TG #504

Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов

Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.

1 мин
11 ИЮН
Daily · xAI · xAI (Grok) · TG #502

Grok Build получил встроенный магазин плагинов — MongoDB, Sentry и Vercel с одной команды

Каждый плагин закреплён за конкретным коммитом SHA — xAI верифицирует его при установке.

1 мин
11 ИЮН
Daily · HuggingFace · HuggingFace · TG #500

nn.Linear под профилировщиком: transpose не трогает GPU

Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.

1 мин
11 ИЮН
Daily · Runway · Runway · TG #499

Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним

Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.

1 мин
10 ИЮН
Daily · xAI · xAI (Grok) · TG #494

Инвестиционный агент Tori от eToro теперь читает настроения рынка прямо из X

Тот же поток данных xAI открыл через API — любая команда может подключиться за несколько минут.

1 мин
10 ИЮН
Daily · OpenRouter · OpenRouter · TG #490

OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла

Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.

2 мин
10 ИЮН
Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин
09 ИЮН
Daily · ElevenLabs · X · ElevenLabs · TG #485

ElevenLabs открыл API для разработчиков по всему миру — Grab уже тестирует

Географических ограничений больше нет — и первый публичный кейс пришёл из Юго-Восточной Азии.

1 мин
09 ИЮН
Daily · xAI · xAI (Grok) · TG #482

Grok теперь собирает корзину в Gopuff до того, как вы открыли приложение

xAI тянет сигналы из X и данные о погоде, чтобы предугадывать заказы — первый публичный кейс Grok-агента в ритейле.

1 мин
09 ИЮН
Daily · OpenRouter · OpenRouter · TG #481

Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем

$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.

1 мин
09 ИЮН
Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин
09 ИЮН
Daily · HuggingFace · HuggingFace · TG #476

Hugging Face Spaces стали API-блоками для агентов — 3D-галерея Парижа без единой строки интеграции

Файл agents.md отдаёт схему, эндпоинты и инструкцию по загрузке файлов одним curl — агент читает и сразу вызывает Space.

1 мин
08 ИЮН
Daily · ElevenLabs · X · ElevenLabs · TG #475

Один API-запрос — и агент ElevenLabs сам снял видео

Агент исследует тему, пишет HTML/CSS и рендерит MP4 через HyperFrames — без ручного монтажа.

1 мин
08 ИЮН
Daily · OpenRouter · OpenRouter · TG #468

Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench

Модель полностью открыта (Apache-2.0) и построена поверх Qwen3.5 — можно развернуть самостоятельно или сразу звать через API.

1 мин
08 ИЮН
Daily · HuggingFace · HuggingFace · TG #466

OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление

Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.

2 мин
07 ИЮН
Daily · HuggingFace · HuggingFace · TG #463

Her читает JSONL-логи Claude Code и находит рискованные действия агента

Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.

1 мин
06 ИЮН
Daily · HuggingFace · HuggingFace · TG #459

Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU

Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.

1 мин
05 ИЮН
Daily · HuggingFace · HuggingFace · TG #457

Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри

100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.

2 мин
04 ИЮН
Daily · HuggingFace · HuggingFace · TG #449

DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок

Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.

2 мин
04 ИЮН
Daily · Runway · Runway · TG #448

Veo 3.1 на Runway перестал генерировать видео

Движок принадлежит Google — Runway только ждёт, пока там починят.

1 мин
03 ИЮН
Daily · ElevenLabs · X · ElevenLabs · TG #444

ElevenLabs показала, как создать приложение голосом

Вы голосом описываете, что хотите, — а система сама собирает готовое приложение под ваш запрос.

1 мин
03 ИЮН
Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

1 мин
03 ИЮН
Daily · HuggingFace · HuggingFace · TG #436

Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes

В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.

1 мин
03 ИЮН
Daily · Runway · Runway

Runway расследует повышенный уровень ошибок в Seedance и Seedream

Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.

1 мин
02 ИЮН
Daily · OpenRouter · OpenRouter

На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft

Три модели MAI — через тот же API, что и текстовые LLM; платформа выходит за пределы чата.

1 мин
02 ИЮН
Daily · ElevenLabs · X · ElevenLabs

Reachy Mini заговорил без облака: Parakeet + Gemma 4 E4B + Qwen3TTS на борту

Как три open-source модели складываются в полный голосовой цикл на $300 роботе.

1 мин
02 ИЮН
Daily · Runway · Runway

Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам

Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.

1 мин
02 ИЮН
Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

1 мин
02 ИЮН
Daily · HuggingFace · HuggingFace

Holo3.1: computer-use агент теперь работает локально и на мобильных

Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…

1 мин