live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
12 ИЮН
Daily · OpenRouter · OpenRouter · TG #506

Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление

На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.

1 мин
10 ИЮН
Daily · Cohere · X · Cohere · TG #496

Цифра «80% работников под угрозой ИИ» устарела — Cohere Labs объясняет почему

Один показатель из 2023 года правит дискуссией в парламентах — хотя три его ограничения накапливаются, а не просто суммируются.

2 мин
10 ИЮН
Daily · OpenRouter · OpenRouter · TG #490

OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла

Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.

2 мин
10 ИЮН
Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин
09 ИЮН
Daily · Cohere · X · Cohere · TG #484

Cohere выпустила North Mini Code — первую открытую модель для кода под Apache 2.0

Маленькая, бесплатная и работает локально — намеренный разворот от корпоративного закрытого AI.

1 мин
09 ИЮН
Daily · OpenRouter · OpenRouter · TG #481

Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем

$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.

1 мин
09 ИЮН
Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин
09 ИЮН
Daily · Cohere · Cohere · TG #472

North-Mini-Code-1.0 от Cohere запускается на локальном железе — без облака

30B параметров суммарно, но в работе — только 3B; Apache 2.0, контекст 256K.

1 мин
08 ИЮН
Daily · Cohere · X · Cohere · TG #474

Cohere открыла Tiny Aya и Transcribe — модели до 3.3B, работающие без облака

Transcribe в 3× быстрее аналогов по пропускной способности и занял первое место на Open ASR Leaderboard по английскому.

2 мин
08 ИЮН
Daily · OpenRouter · OpenRouter · TG #468

Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench

Модель полностью открыта (Apache-2.0) и построена поверх Qwen3.5 — можно развернуть самостоятельно или сразу звать через API.

1 мин
08 ИЮН
Daily · Alibaba · Alibaba · TG #465

Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле

Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.

2 мин
03 ИЮН
Daily · Cohere · X · Cohere · TG #443

Cohere Labs открыла бесплатный инструмент для построения графиков

Co/plot позволяет быстро менять и уточнять графики без перезапуска скриптов и ручной перерисовки данных.

1 мин
03 ИЮН
Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

1 мин
03 ИЮН
Daily · Alibaba · Alibaba

Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди

100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.

2 мин
02 ИЮН
Daily · OpenRouter · OpenRouter

На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft

Три модели MAI — через тот же API, что и текстовые LLM; платформа выходит за пределы чата.

1 мин
02 ИЮН
Daily · Cohere · X · Cohere

Cohere Labs запускает бенчмарк культурных загадок и ищет экспертов со всего мира

Параллельно — дискуссия о том, нужен ли агентам «язык чувств» для координации.

1 мин
02 ИЮН
Daily · Together AI · Together AI

Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput

Together AI раскрыла инженерные решения, позволившие обслуживать MiniMax M3 (1M токенов, нативная мультимодальность, MSA-архитектура) с приростом throughput 81–125% на разных уровнях конкурентности. Это первый публичный…

2 мин
02 ИЮН
Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

1 мин
01 ИЮН
Daily · OpenRouter · OpenRouter

OpenRouter: 100 триллионов токенов, $113M и пять новых enterprise-функций за май

OpenRouter закрыл Series B на $113M и достиг 100 трлн токенов в месяц — на этом фоне майский релиз показывает, куда идут деньги: в enterprise-контроль, мультимодельный ансамбль и голосовые API поверх единого ключа…

1 мин
01 ИЮН
Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

1 мин
01 ИЮН
Daily · Alibaba · Alibaba

Quick BI против галлюцинирующих агентов: почему данные важнее модели

На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…

2 мин
01 ИЮН
Daily · Cohere · X · Cohere

Cohere Labs идёт на хакатон Hugging Face со своими малыми моделями

Cohere Labs поддержала хакатон «Build. Small.» от Hugging Face и Gradio, назвав Tiny Aya и Cohere Transcribe рекомендованными моделями для участников. Это первое явное позиционирование компании в нише компактных моделей…

1 мин
31 МАЯ
Daily · OpenRouter · OpenRouter

OpenRouter задокументировал Fusion Router: что внутри пайплайна panel → judge → synthesis

OpenRouter впервые опубликовал полную документацию Fusion Router — с описанием конфигурации, схемой трёхэтапного конвейера и поведением при сбоях. До этого фича существовала без внятного описания; теперь её можно…

1 мин
29 МАЯ
Daily · Cohere · X · Cohere

Cohere Labs анонсирует новое исследование Self-Verified RL с использованием Soft-Rewards

Модель Command A+ превзошла конкурентов в машинном переводе, параллельно компания представила новаторское исследование Soft-SVeRL.

7 мин
29 МАЯ
Daily · Together AI · Together AI

Together AI: как построить рекордно быстрый Speech-to-Text стек

Together AI представила детальное техническое описание оптимизации всего стека преобразования речи в текст, включая GPU, CPU, память и сетевые протоколы, установив новый мировой рекорд скорости.

8 мин
29 МАЯ
Daily · OpenRouter · OpenRouter

Guardrails от OpenRouter: Как защитить агентов, данные и бюджет от произвола LLM

OpenRouter представил функцию Guardrails, предлагающую набор настраиваемых инструментов для контроля безопасности, приватности и расходов LLM-приложений.

7 мин
29 МАЯ
Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин
29 МАЯ
Daily · Alibaba · Alibaba · TG #331

Qwen-VLA: От осмысления к активному вмешательству в реальный мир

Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.

10 мин
28 МАЯ
Daily · Replicate · Replicate

Снижение производительности flux-2-klein-4b

Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.

1 мин
28 МАЯ
Daily · OpenRouter · OpenRouter

Фильтрация IP-адресов для корпоративных планов OpenRouter

OpenRouter добавила возможность ограничить использование API-ключей утвержденными IP-диапазонами, повышая безопасность для организаций.

6 мин