Новости AI-стека
Daily · свежие материалы
Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление
На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.
Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним
Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла
Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем
$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.
Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке
Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.
Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench
Модель полностью открыта (Apache-2.0) и построена поверх Qwen3.5 — можно развернуть самостоятельно или сразу звать через API.
Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле
Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.
Veo 3.1 на Runway перестал генерировать видео
Движок принадлежит Google — Runway только ждёт, пока там починят.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
Runway расследует повышенный уровень ошибок в Seedance и Seedream
Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.
Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди
100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.
На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft
Три модели MAI — через тот же API, что и текстовые LLM; платформа выходит за пределы чата.
Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам
Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
OpenRouter: 100 триллионов токенов, $113M и пять новых enterprise-функций за май
OpenRouter закрыл Series B на $113M и достиг 100 трлн токенов в месяц — на этом фоне майский релиз показывает, куда идут деньги: в enterprise-контроль, мультимодельный ансамбль и голосовые API поверх единого ключа…
Runway вложит $100 млн в лондонский хаб по world models
$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…
Gemini 2.0 Flash отключён — что ставить вместо него
1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…
Quick BI против галлюцинирующих агентов: почему данные важнее модели
На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…
OpenRouter задокументировал Fusion Router: что внутри пайплайна panel → judge → synthesis
OpenRouter впервые опубликовал полную документацию Fusion Router — с описанием конфигурации, схемой трёхэтапного конвейера и поведением при сбоях. До этого фича существовала без внятного описания; теперь её можно…
Guardrails от OpenRouter: Как защитить агентов, данные и бюджет от произвола LLM
OpenRouter представил функцию Guardrails, предлагающую набор настраиваемых инструментов для контроля безопасности, приватности и расходов LLM-приложений.
happyhorse: генерация видео с контролем длительности и формата
HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Nova-3 Medical: точность в медицине растет, но что с остальным?
Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.
Qwen-VLA: От осмысления к активному вмешательству в реальный мир
Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.
Seedance 2.0 теперь доступен через API Runway
Модель Seedance 2.0, разработанная сторонней командой, теперь доступна через API Runway, предлагая расширенные функции для генерации видео из различных типов данных.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Фильтрация IP-адресов для корпоративных планов OpenRouter
OpenRouter добавила возможность ограничить использование API-ключей утвержденными IP-диапазонами, повышая безопасность для организаций.