Новости AI-стека
Daily · свежие материалы
США принудительно отключили Fable 5 и Mythos 5 — Anthropic не согласна
Компания выполнила директиву, но заявила: тот же трюк работает на GPT-5.5, и по такому стандарту придётся остановить весь рынок.
AI-компаниям доверяют меньше, чем правительству — опрос 52 000 американцев
Семь из десяти американцев хотят госрегулирования AI — и это мнение не делится по партиям.
Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление
На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.
Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов
Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.
Grok Build получил встроенный магазин плагинов — MongoDB, Sentry и Vercel с одной команды
Каждый плагин закреплён за конкретным коммитом SHA — xAI верифицирует его при установке.
nn.Linear под профилировщиком: transpose не трогает GPU
Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.
Anthropic платит 1 000 стажёров $85 000 в год, чтобы внедрить Claude в некоммерческие организации
$150 млн на программу — ни цента от принимающих организаций: зарплату, обучение и поддержку берёт на себя Anthropic.
Цифра «80% работников под угрозой ИИ» устарела — Cohere Labs объясняет почему
Один показатель из 2023 года правит дискуссией в парламентах — хотя три его ограничения накапливаются, а не просто суммируются.
Инвестиционный агент Tori от eToro теперь читает настроения рынка прямо из X
Тот же поток данных xAI открыл через API — любая команда может подключиться за несколько минут.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
Claude Managed Agents берёт инфраструктуру агента на себя — команде остаётся доменная логика
Harness обновляется вместе с моделью: то, что ломало агент на Sonnet 4.5, на Opus 4.5 уже не нужно.
OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла
Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.
Cohere выпустила North Mini Code — первую открытую модель для кода под Apache 2.0
Маленькая, бесплатная и работает локально — намеренный разворот от корпоративного закрытого AI.
Claude Fable 5 вышел для всех — с отключёнными опасными возможностями
Полная версия Mythos 5 доступна только киберзащитникам через государственную программу — остальные получают модель с фильтрами, которые срабатывают в среднем в менее чем 5% сессий.
Grok теперь собирает корзину в Gopuff до того, как вы открыли приложение
xAI тянет сигналы из X и данные о погоде, чтобы предугадывать заказы — первый публичный кейс Grok-агента в ритейле.
Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем
$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.
Claude Fable 5 вышел с 1M контекстом — но мышление не отключить и данные хранятся 30 дней
Новый токенизатор генерирует на 30% больше токенов — реальная стоимость выше, чем кажется по прайсу $10/$50 за миллион.
Hugging Face Spaces стали API-блоками для агентов — 3D-галерея Парижа без единой строки интеграции
Файл agents.md отдаёт схему, эндпоинты и инструкцию по загрузке файлов одним curl — агент читает и сразу вызывает Space.
North-Mini-Code-1.0 от Cohere запускается на локальном железе — без облака
30B параметров суммарно, но в работе — только 3B; Apache 2.0, контекст 256K.
Cohere открыла Tiny Aya и Transcribe — модели до 3.3B, работающие без облака
Transcribe в 3× быстрее аналогов по пропускной способности и занял первое место на Open ASR Leaderboard по английскому.
Claude не может надёжно скачать вирусные геномы — и это не баг модели
Детерминированный слой поверх NCBI поднимает точность с 16–91% до почти 100% — значит, проблема не в модели.
Авторы коннекторов для Claude получили дашборд с метриками и ошибками
Подать коннектор в каталог теперь можно прямо из интерфейса — без отдельных форм.
Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench
Модель полностью открыта (Apache-2.0) и построена поверх Qwen3.5 — можно развернуть самостоятельно или сразу звать через API.
OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление
Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.
Her читает JSONL-логи Claude Code и находит рискованные действия агента
Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.
Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU
Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.
Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри
100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.
Claude Opus 4.7 предсказывает ЯМР-спектры так же точно, как ChemDraw
И в обратную сторону: модель восстанавливает структуру молекулы из спектра — без лицензионного ПО и специальной настройки.
DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок
Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.