Новости AI-стека
Daily · свежие материалы
OpenRouter Fusion запускает несколько моделей сразу и сравнивает их ответы
Внутри — панель из нескольких LLM и модель-судья, которая ищет противоречия и пробелы в их ответах.
Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление
На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.
OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла
Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем
$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.
Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке
Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.
Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench
Модель полностью открыта (Apache-2.0) и построена поверх Qwen3.5 — можно развернуть самостоятельно или сразу звать через API.
Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле
Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди
100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.
На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft
Три модели MAI — через тот же API, что и текстовые LLM; платформа выходит за пределы чата.
OpenRouter: 100 триллионов токенов, $113M и пять новых enterprise-функций за май
OpenRouter закрыл Series B на $113M и достиг 100 трлн токенов в месяц — на этом фоне майский релиз показывает, куда идут деньги: в enterprise-контроль, мультимодельный ансамбль и голосовые API поверх единого ключа…
Gemini 2.0 Flash отключён — что ставить вместо него
1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…
Quick BI против галлюцинирующих агентов: почему данные важнее модели
На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…
OpenRouter задокументировал Fusion Router: что внутри пайплайна panel → judge → synthesis
OpenRouter впервые опубликовал полную документацию Fusion Router — с описанием конфигурации, схемой трёхэтапного конвейера и поведением при сбоях. До этого фича существовала без внятного описания; теперь её можно…
Guardrails от OpenRouter: Как защитить агентов, данные и бюджет от произвола LLM
OpenRouter представил функцию Guardrails, предлагающую набор настраиваемых инструментов для контроля безопасности, приватности и расходов LLM-приложений.
Qwen-VLA: От осмысления к активному вмешательству в реальный мир
Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.
Фильтрация IP-адресов для корпоративных планов OpenRouter
OpenRouter добавила возможность ограничить использование API-ключей утвержденными IP-диапазонами, повышая безопасность для организаций.
Gemini Image Models: видео в картинку, но не для всех
Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.
qwen-cloud: облако, где агенты говорят на одном языке
Alibaba Cloud представила Qwen Cloud 26 мая в Сингапуре, создав AI-нативную платформу для работы с агентами и мультимодальными моделями.
OpenRouter: Claude Opus 4.8 уже здесь, а платформа получила $113M и новый API
Платформа OpenRouter значительно расширила свои предложения, добавив модели Claude Opus 4.8 и Opus 4.8 Fast, а также привлекла $113 млн в рамках раунда финансирования Серии B.
Alibaba Cloud: комплексная экосистема для агентного ИИ и глобального масштаба
На первой международной конференции Qwen в Сингапуре Alibaba Cloud представила новые модели, инфраструктуру и инструменты для построения и управления ИИ-агентами.
OpenRouter: детализация моделей, умный маршрутизатор и строгие IP-списки
OpenRouter представил обновления, включающие улучшенные инструменты выбора моделей, гибкую автоматическую маршрутизацию с контролем стоимости и усиление безопасности IP-адресов.
Vertex AI Extensions уходят: Google переводит фокус на Agent Platform
Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.
OpenRouter: логи, ключи API и видеоошибки теперь в одном клике
Обновления от 25 мая 2026 года упрощают навигацию по логам, доступ к деталям API-ключей и диагностику ошибок видеогенерации.
qwen3: гибридные рассуждения и сотни миллионов загрузок
Alibaba представила Qwen3 — новое поколение своих открытых больших языковых моделей, вводя гибридные режимы рассуждений и расширяя возможности агентов и многоязычной поддержки.
qwen3.5-livetranslate-Flash: Переводит речь, видит контекст, клонирует голос
Alibaba выпустила qwen3.5-livetranslate-Flash, новейшую модель синхронного перевода, которая не просто слушает и переводит речь, но и понимает визуальный контекст. Эта многомодальная система, построенная на архитектуре…
Qwen3.7 Max: миллион токенов на OpenRouter и новый взгляд на API-ключи
OpenRouter обновил свою платформу, добавив поддержку модели Qwen3.7 Max от Qwen, известной своим большим контекстным окном. Одновременно с этим, пользователи получили расширенные возможности по управлению историей чатов…
Google DeepMind Accelerator: AI против климатических рисков в АТР
Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…
Qwen3.7-Max: Модель для агентов и перевод, который видит
Alibaba представила две новые модели: Qwen3.7-Max, ориентированную на автономных агентов, и Qwen3.5-LiveTranslate-Flash, способную к синхронному переводу с учетом визуального контекста. Это развитие AI-возможностей…