Новости AI-стека
Daily · свежие материалы
Her читает JSONL-логи Claude Code и находит рискованные действия агента
Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.
Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU
Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.
Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри
100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.
Claude Opus 4.7 предсказывает ЯМР-спектры так же точно, как ChemDraw
И в обратную сторону: модель восстанавливает структуру молекулы из спектра — без лицензионного ПО и специальной настройки.
DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок
Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.
ИИ превращает неопытных хакеров в серьёзную угрозу
Anthropic год отслеживала реальные атаки через свою модель и выяснила, что ИИ теперь сам выполняет сложные этапы взлома вместо человека.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes
В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.
Код больше не узкое место: как Anthropic перестроила инженерные процессы под агентное кодирование
Директор по инжинирингу Claude Code Фиона Фунг на конференции Code w/ Claude SF 2026 разобрала, что конкретно сломалось в старых процессах, когда агентное кодирование стало дефолтным режимом работы — и чем команда это…
На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft
Три модели MAI — через тот же API, что и текстовые LLM; платформа выходит за пределы чата.
Project Glasswing расширяется до 150 организаций — Anthropic готовится к миру, где Mythos-класс станет массовым
Bottleneck сместился с поиска уязвимостей на их верификацию и патчинг — и это меняет всю модель киберзащиты.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
Holo3.1: computer-use агент теперь работает локально и на мобильных
Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…
Claude Code 2.1.161: параллельные инструменты больше не падают цепочкой
Anthropic выпустила Claude Code v2.1.161 с двумя изменениями, напрямую влияющими на агентные пайплайны: отказ одного Bash-вызова в параллельном батче больше не отменяет остальные, а регрессия managed-политик, сломавшая…
OpenRouter: 100 триллионов токенов, $113M и пять новых enterprise-функций за май
OpenRouter закрыл Series B на $113M и достиг 100 трлн токенов в месяц — на этом фоне майский релиз показывает, куда идут деньги: в enterprise-контроль, мультимодельный ансамбль и голосовые API поверх единого ключа…
Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков
JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.
Anthropic подала конфиденциальный S-1 на IPO
Anthropic, PBC конфиденциально подала черновик регистрационного заявления S-1 в SEC — первый шаг к IPO компании, которая за полгода выросла с оценки $350 млрд до $965 млрд и пересекла отметку $47 млрд годовой выручки.
Anthropic подала конфиденциальный S-1 в SEC
Через три дня после закрытия раунда Series H на $65B при оценке $965B Anthropic конфиденциально подала регистрационное заявление S-1 в SEC — первый формальный шаг к IPO. Интересно здесь не то, что компания идёт на…
OpenRouter задокументировал Fusion Router: что внутри пайплайна panel → judge → synthesis
OpenRouter впервые опубликовал полную документацию Fusion Router — с описанием конфигурации, схемой трёхэтапного конвейера и поведением при сбоях. До этого фича существовала без внятного описания; теперь её можно…
v2.1.159
Выпущена версия v2.1.159 с внутренними улучшениями инфраструктуры без изменений, видимых пользователям.
Claude Code: автоматический режим пришёл на все основные платформы
Anthropic расширяет автоматический режим Claude Code версии 2.1.158 на все основные облачные платформы, отменяя требование согласия на использование.
Выпущен smolagents v1.26.0
В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.
Ноа Цвебен (менеджер по продукту Claude Code) делится интересным вариантом использования: Go bun go
Сотрудники Anthropic поделились деталями использования Claude Code, включая ускорение разработки для Salesforce и эффективное взаимодействие с Go и ORM Bun.
Guardrails от OpenRouter: Как защитить агентов, данные и бюджет от произвола LLM
OpenRouter представил функцию Guardrails, предлагающую набор настраиваемых инструментов для контроля безопасности, приватности и расходов LLM-приложений.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Фильтрация IP-адресов для корпоративных планов OpenRouter
OpenRouter добавила возможность ограничить использование API-ключей утвержденными IP-диапазонами, повышая безопасность для организаций.
Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI
Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.
Anthropic выпустил Claude Opus 4.8
Anthropic представила обновленную модель Claude Opus 4.8 с улучшенными возможностями кодирования и новыми функциями, одновременно объявив о привлечении $65 млрд в раунде финансирования Серии H.