Новости AI-стека
Daily · свежие материалы
США принудительно отключили Fable 5 и Mythos 5 — Anthropic не согласна
Компания выполнила директиву, но заявила: тот же трюк работает на GPT-5.5, и по такому стандарту придётся остановить весь рынок.
AI-компаниям доверяют меньше, чем правительству — опрос 52 000 американцев
Семь из десяти американцев хотят госрегулирования AI — и это мнение не делится по партиям.
Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов
Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.
nn.Linear под профилировщиком: transpose не трогает GPU
Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.
Anthropic платит 1 000 стажёров $85 000 в год, чтобы внедрить Claude в некоммерческие организации
$150 млн на программу — ни цента от принимающих организаций: зарплату, обучение и поддержку берёт на себя Anthropic.
Цифра «80% работников под угрозой ИИ» устарела — Cohere Labs объясняет почему
Один показатель из 2023 года правит дискуссией в парламентах — хотя три его ограничения накапливаются, а не просто суммируются.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
Claude Managed Agents берёт инфраструктуру агента на себя — команде остаётся доменная логика
Harness обновляется вместе с моделью: то, что ломало агент на Sonnet 4.5, на Opus 4.5 уже не нужно.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
Cohere выпустила North Mini Code — первую открытую модель для кода под Apache 2.0
Маленькая, бесплатная и работает локально — намеренный разворот от корпоративного закрытого AI.
Claude Fable 5 вышел для всех — с отключёнными опасными возможностями
Полная версия Mythos 5 доступна только киберзащитникам через государственную программу — остальные получают модель с фильтрами, которые срабатывают в среднем в менее чем 5% сессий.
Ray3.2 от Luma: покадровое управление видео и первый полноценный API
До 16 кейфреймов в одном клипе и 16-bit EXR на выходе — впервые всё это доступно через API; 5 секунд в 1080p стоят $1.20.
Claude Fable 5 вышел с 1M контекстом — но мышление не отключить и данные хранятся 30 дней
Новый токенизатор генерирует на 30% больше токенов — реальная стоимость выше, чем кажется по прайсу $10/$50 за миллион.
Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке
Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.
Hugging Face Spaces стали API-блоками для агентов — 3D-галерея Парижа без единой строки интеграции
Файл agents.md отдаёт схему, эндпоинты и инструкцию по загрузке файлов одним curl — агент читает и сразу вызывает Space.
North-Mini-Code-1.0 от Cohere запускается на локальном железе — без облака
30B параметров суммарно, но в работе — только 3B; Apache 2.0, контекст 256K.
Cohere открыла Tiny Aya и Transcribe — модели до 3.3B, работающие без облака
Transcribe в 3× быстрее аналогов по пропускной способности и занял первое место на Open ASR Leaderboard по английскому.
Claude не может надёжно скачать вирусные геномы — и это не баг модели
Детерминированный слой поверх NCBI поднимает точность с 16–91% до почти 100% — значит, проблема не в модели.
Авторы коннекторов для Claude получили дашборд с метриками и ошибками
Подать коннектор в каталог теперь можно прямо из интерфейса — без отдельных форм.
OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление
Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.
Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле
Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.
Her читает JSONL-логи Claude Code и находит рискованные действия агента
Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.
Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU
Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.
Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри
100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.
Claude Opus 4.7 предсказывает ЯМР-спектры так же точно, как ChemDraw
И в обратную сторону: модель восстанавливает структуру молекулы из спектра — без лицензионного ПО и специальной настройки.
DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок
Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
Cohere Labs открыла бесплатный инструмент для построения графиков
Co/plot позволяет быстро менять и уточнять графики без перезапуска скриптов и ручной перерисовки данных.
ИИ превращает неопытных хакеров в серьёзную угрозу
Anthropic год отслеживала реальные атаки через свою модель и выяснила, что ИИ теперь сам выполняет сложные этапы взлома вместо человека.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.