Новости AI-стека
Daily · свежие материалы
GitHub Copilot стал отдельным десктопным приложением с параллельными агентскими сессиями
Плюс авторутинг между GPT-5.4, Claude и Haiku — со скидкой 10% за автоматический выбор модели.
Deepgram открыл австралийский эндпоинт — данные не покидают страну
Один URL вместо self-hosted: те же ключи, те же цены — и аудио остаётся в Австралии.
Envato сгенерировала 51 млн изображений через FLUX — и запустила FLUX.2 в первый день релиза
FLUX.2 загружают на 16% чаще среднего по платформе — и он обгоняет конкурентов на 10% в фотореалистичных сценах.
Anthropic открыл офис в Сеуле — Claude Code уже у тысяч инженеров NAVER и Samsung
IT-подразделения Samsung, LG и Hanwha развернули Claude внутри — охват может каскадом пройти по всей группе каждого чеболя.
AWS Strands Robots: один код — и симуляция, и реальный робот
LeRobot хранит демонстрации из симулятора и с железа в одном формате — агент не замечает разницы.
Gemini 3.1 Flash TTS отдаёт аудио потоком, не дожидаясь конца генерации
Управление темпом, акцентом и тоном через промпт остаётся — задержка до первого байта падает.
Бухгалтер с Claude Code успевает не хуже программиста — данные 400 тысяч сессий
За семь месяцев ценность типичной задачи выросла на 27%, а доля сессий с отладкой упала вдвое.
Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство
Прототип на Gemini берёт на себя сбор данных и черновик решения — чиновник остаётся финальным арбитром.
GLM 5.2 появилась на OpenRouter с контекстом в 1 млн токенов
Модель от Zhipu AI доступна через единый API OpenRouter — без отдельного аккаунта у китайского вендора.
13 бесплатных LLM API сравнили в одной таблице — у каждого своя скрытая цена
Mistral даёт 1 млрд токенов в месяц, но требует согласия на обучение; Google сливает промпты за пределами ЕС.
Veo 2.0 и 3.0 отключат 30 июня — до дедлайна две недели
Imagen 4 уходит в августе, а единственная замена для Veo — модели в статусе preview, не GA.
Claude Sonnet 4 и Opus 4 выключены — запросы возвращают ошибку
Замены — Sonnet 4.6 и Opus 4.8; исследователи могут запросить отдельный доступ через специальную программу.
Microsoft Foundry сам отбирает нужные трассировки и гоняет бенчмарки на вашем агенте
Умная выборка даёт +44% словарного охвата против случайной — и это важнее, чем кажется при файнтюнинге.
OpenRouter Fusion запускает несколько моделей сразу и сравнивает их ответы
Внутри — панель из нескольких LLM и модель-судья, которая ищет противоречия и пробелы в их ответах.
США принудительно отключили Fable 5 и Mythos 5 — Anthropic не согласна
Компания выполнила директиву, но заявила: тот же трюк работает на GPT-5.5, и по такому стандарту придётся остановить весь рынок.
AI-компаниям доверяют меньше, чем правительству — опрос 52 000 американцев
Семь из десяти американцев хотят госрегулирования AI — и это мнение не делится по партиям.
Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление
На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.
Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов
Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.
GitHub Agentic Workflows вышел в публичный доступ — агенты на Markdown без PAT
Автоматизация описывается на естественном языке и компилируется в Actions YAML — а AI-кредиты идут напрямую на счёт организации.
nn.Linear под профилировщиком: transpose не трогает GPU
Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.
Anthropic платит 1 000 стажёров $85 000 в год, чтобы внедрить Claude в некоммерческие организации
$150 млн на программу — ни цента от принимающих организаций: зарплату, обучение и поддержку берёт на себя Anthropic.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
Claude Managed Agents берёт инфраструктуру агента на себя — команде остаётся доменная логика
Harness обновляется вместе с моделью: то, что ломало агент на Sonnet 4.5, на Opus 4.5 уже не нужно.
OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла
Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
GitHub Copilot CLI теперь ищет уязвимости прямо в терминале
Команда /security-review работает независимо от Code Scanning и Dependabot — как отдельный, более ранний рубеж защиты.
Claude Fable 5 вышел для всех — с отключёнными опасными возможностями
Полная версия Mythos 5 доступна только киберзащитникам через государственную программу — остальные получают модель с фильтрами, которые срабатывают в среднем в менее чем 5% сессий.
Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем
$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.
Ray3.2 от Luma: покадровое управление видео и первый полноценный API
До 16 кейфреймов в одном клипе и 16-bit EXR на выходе — впервые всё это доступно через API; 5 секунд в 1080p стоят $1.20.
Claude Fable 5 вышел с 1M контекстом — но мышление не отключить и данные хранятся 30 дней
Новый токенизатор генерирует на 30% больше токенов — реальная стоимость выше, чем кажется по прайсу $10/$50 за миллион.