Новости AI-стека
Daily · свежие материалы
OpenRouter Fusion запускает несколько моделей сразу и сравнивает их ответы
Внутри — панель из нескольких LLM и модель-судья, которая ищет противоречия и пробелы в их ответах.
Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление
На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.
OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла
Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.
Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем
$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.
Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench
Модель полностью открыта (Apache-2.0) и построена поверх Qwen3.5 — можно развернуть самостоятельно или сразу звать через API.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft
Три модели MAI — через тот же API, что и текстовые LLM; платформа выходит за пределы чата.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
OpenRouter: 100 триллионов токенов, $113M и пять новых enterprise-функций за май
OpenRouter закрыл Series B на $113M и достиг 100 трлн токенов в месяц — на этом фоне майский релиз показывает, куда идут деньги: в enterprise-контроль, мультимодельный ансамбль и голосовые API поверх единого ключа…
MiniMax-M3: 1M-контекст через Anthropic SDK за $0.30/M токенов
MiniMax выпустил M3 — агентскую мультимодальную модель с окном 1M токенов, которая подключается как drop-in замена через Anthropic SDK, а в первые 7 дней стоит вдвое дешевле прайса.
OpenRouter задокументировал Fusion Router: что внутри пайплайна panel → judge → synthesis
OpenRouter впервые опубликовал полную документацию Fusion Router — с описанием конфигурации, схемой трёхэтапного конвейера и поведением при сбоях. До этого фича существовала без внятного описания; теперь её можно…
Guardrails от OpenRouter: Как защитить агентов, данные и бюджет от произвола LLM
OpenRouter представил функцию Guardrails, предлагающую набор настраиваемых инструментов для контроля безопасности, приватности и расходов LLM-приложений.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Фильтрация IP-адресов для корпоративных планов OpenRouter
OpenRouter добавила возможность ограничить использование API-ключей утвержденными IP-диапазонами, повышая безопасность для организаций.
FLUX VTO: виртуальная примерка в масштабе каталога
Black Forest Labs анонсировала FLUX VTO — новую технологию виртуальной примерки одежды, предназначенную для ритейлеров, которая обеспечивает высокую скорость, точность рендеринга и гибкость стилизации для больших…
OpenRouter: Claude Opus 4.8 уже здесь, а платформа получила $113M и новый API
Платформа OpenRouter значительно расширила свои предложения, добавив модели Claude Opus 4.8 и Opus 4.8 Fast, а также привлекла $113 млн в рамках раунда финансирования Серии B.
OpenRouter: детализация моделей, умный маршрутизатор и строгие IP-списки
OpenRouter представил обновления, включающие улучшенные инструменты выбора моделей, гибкую автоматическую маршрутизацию с контролем стоимости и усиление безопасности IP-адресов.
OpenRouter: логи, ключи API и видеоошибки теперь в одном клике
Обновления от 25 мая 2026 года упрощают навигацию по логам, доступ к деталям API-ключей и диагностику ошибок видеогенерации.
Qwen3.7 Max: миллион токенов на OpenRouter и новый взгляд на API-ключи
OpenRouter обновил свою платформу, добавив поддержку модели Qwen3.7 Max от Qwen, известной своим большим контекстным окном. Одновременно с этим, пользователи получили расширенные возможности по управлению историей чатов…
FLUX Outpainting: ИИ-расширение изображений в один API-вызов, без промтов
Black Forest Labs представила новую возможность для своей линейки FLUX Tools — FLUX Outpainting. Инструмент позволяет расширять любое изображение за его исходные границы, автоматически сохраняя при этом целостность…
OpenRouter: Агенты с человеческим участием и модель Ring-2.6-1T
Сложные задачи часто требуют человеческого суждения, но рутина должна автоматизироваться. Как найти этот баланс в работе AI-агентов? OpenRouter представляет новый тип инструментов для своего Agent SDK, который позволяет…
gpt-5.5: двойное повышение цен, но реальная стоимость не так однозначна
OpenRouter провел собственное исследование влияния новой модели gpt-5.5 на бюджеты разработчиков. Несмотря на заявленное OpenAI двукратное увеличение цен за токены, внутренняя аналитика OpenRouter показала, что итоговый…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
MiniMax-M2.7: модель, которая учит себя программировать
MiniMax представила новую модель MiniMax-M2.7 на Hugging Face, и она примечательна заявленной способностью к самоэволюции. Это означает, что модель не просто выполняет задачи, но активно участвует в собственном…
AI-новости
Обратите внимание на pipe.enable_model_cpu_offload() — эта строка кода демонстрирует типичную технику для дальнейшей оптимизации использования VRAM, перемещая части модели в CPU по мере необходимости.
MiniMax Music-2.6: Музыкальный ИИ теперь пишет и тексты, и инструментал
MiniMax представила новую версию своей модели для генерации музыки Music-2.6. Теперь ИИ может не только создавать музыкальные композиции по текстовому описанию, но и автоматически генерировать тексты песен, а также…
MiniMax M2.7: первые отголоски самоэволюции
MiniMax выпустила серию моделей M2.7, заявляя о старте рекурсивного самосовершенствования своих AI-систем. Теперь модели участвуют в собственной эволюции, самостоятельно улучшая свой инструментарий и процессы обучения…