Новости AI-стека
Daily · свежие материалы
OpenRouter Fusion запускает несколько моделей сразу и сравнивает их ответы
Внутри — панель из нескольких LLM и модель-судья, которая ищет противоречия и пробелы в их ответах.
США принудительно отключили Fable 5 и Mythos 5 — Anthropic не согласна
Компания выполнила директиву, но заявила: тот же трюк работает на GPT-5.5, и по такому стандарту придётся остановить весь рынок.
AI-компаниям доверяют меньше, чем правительству — опрос 52 000 американцев
Семь из десяти американцев хотят госрегулирования AI — и это мнение не делится по партиям.
Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление
На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.
GitHub Agentic Workflows вышел в публичный доступ — агенты на Markdown без PAT
Автоматизация описывается на естественном языке и компилируется в Actions YAML — а AI-кредиты идут напрямую на счёт организации.
Anthropic платит 1 000 стажёров $85 000 в год, чтобы внедрить Claude в некоммерческие организации
$150 млн на программу — ни цента от принимающих организаций: зарплату, обучение и поддержку берёт на себя Anthropic.
Claude Managed Agents берёт инфраструктуру агента на себя — команде остаётся доменная логика
Harness обновляется вместе с моделью: то, что ломало агент на Sonnet 4.5, на Opus 4.5 уже не нужно.
OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла
Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
GitHub Copilot CLI теперь ищет уязвимости прямо в терминале
Команда /security-review работает независимо от Code Scanning и Dependabot — как отдельный, более ранний рубеж защиты.
Claude Fable 5 вышел для всех — с отключёнными опасными возможностями
Полная версия Mythos 5 доступна только киберзащитникам через государственную программу — остальные получают модель с фильтрами, которые срабатывают в среднем в менее чем 5% сессий.
Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем
$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.
Claude Fable 5 вышел с 1M контекстом — но мышление не отключить и данные хранятся 30 дней
Новый токенизатор генерирует на 30% больше токенов — реальная стоимость выше, чем кажется по прайсу $10/$50 за миллион.
GitHub проверяет код от Claude и Codex так же, как от Copilot
Три слоя защиты — CodeQL, проверка зависимостей и сканирование секретов — без лицензии Advanced Security.
Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке
Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.
Claude не может надёжно скачать вирусные геномы — и это не баг модели
Детерминированный слой поверх NCBI поднимает точность с 16–91% до почти 100% — значит, проблема не в модели.
Microsoft Foundry даёт агентам память между сессиями — без внешней базы данных
Состояние хранится в изолированной microVM на сервере; клиент знает только session id.
Авторы коннекторов для Claude получили дашборд с метриками и ошибками
Подать коннектор в каталог теперь можно прямо из интерфейса — без отдельных форм.
Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench
Модель полностью открыта (Apache-2.0) и построена поверх Qwen3.5 — можно развернуть самостоятельно или сразу звать через API.
Claude Opus 4.7 предсказывает ЯМР-спектры так же точно, как ChemDraw
И в обратную сторону: модель восстанавливает структуру молекулы из спектра — без лицензионного ПО и специальной настройки.
GPT-5.2 и GPT-5.2-Codex убраны из GitHub Copilot
Chat, автодополнение и agent-режим перешли на GPT-5.5 и GPT-5.3-Codex — от пользователей действий не требуется, но Enterprise-администраторам стоит проверить политики моделей.
ИИ превращает неопытных хакеров в серьёзную угрозу
Anthropic год отслеживала реальные атаки через свою модель и выяснила, что ИИ теперь сам выполняет сложные этапы взлома вместо человека.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
GitHub Copilot запускает агентов на удалённых машинах — сессия не умирает при отключении
Плюс BYOK в изолированных сетях, оценка риска команд и синхронизация истории между устройствами.
Код больше не узкое место: как Anthropic перестроила инженерные процессы под агентное кодирование
Директор по инжинирингу Claude Code Фиона Фунг на конференции Code w/ Claude SF 2026 разобрала, что конкретно сломалось в старых процессах, когда агентное кодирование стало дефолтным режимом работы — и чем команда это…
На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft
Три модели MAI — через тот же API, что и текстовые LLM; платформа выходит за пределы чата.
Project Glasswing расширяется до 150 организаций — Anthropic готовится к миру, где Mythos-класс станет массовым
Bottleneck сместился с поиска уязвимостей на их верификацию и патчинг — и это меняет всю модель киберзащиты.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
GitHub Copilot Code Review теперь тянет контекст из MCP-серверов и считает кредиты за глубину анализа
На Microsoft Build 2026 GitHub выкатил два обновления Copilot, которые вместе сдвигают инструмент от «умного автодополнения» к агентному слою в CI/CD: code review научился ходить в MCP-серверы за контекстом, а за более…
Claude Code 2.1.161: параллельные инструменты больше не падают цепочкой
Anthropic выпустила Claude Code v2.1.161 с двумя изменениями, напрямую влияющими на агентные пайплайны: отказ одного Bash-вызова в параллельном батче больше не отменяет остальные, а регрессия managed-политик, сломавшая…