Новости AI-стека
Daily · свежие материалы
Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов
Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.
GitHub Agentic Workflows вышел в публичный доступ — агенты на Markdown без PAT
Автоматизация описывается на естественном языке и компилируется в Actions YAML — а AI-кредиты идут напрямую на счёт организации.
nn.Linear под профилировщиком: transpose не трогает GPU
Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.
GitHub Copilot CLI теперь ищет уязвимости прямо в терминале
Команда /security-review работает независимо от Code Scanning и Dependabot — как отдельный, более ранний рубеж защиты.
GitHub проверяет код от Claude и Codex так же, как от Copilot
Три слоя защиты — CodeQL, проверка зависимостей и сканирование секретов — без лицензии Advanced Security.
Hugging Face Spaces стали API-блоками для агентов — 3D-галерея Парижа без единой строки интеграции
Файл agents.md отдаёт схему, эндпоинты и инструкцию по загрузке файлов одним curl — агент читает и сразу вызывает Space.
Microsoft Foundry даёт агентам память между сессиями — без внешней базы данных
Состояние хранится в изолированной microVM на сервере; клиент знает только session id.
OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление
Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.
Her читает JSONL-логи Claude Code и находит рискованные действия агента
Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.
Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU
Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.
Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри
100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.
GPT-5.2 и GPT-5.2-Codex убраны из GitHub Copilot
Chat, автодополнение и agent-режим перешли на GPT-5.5 и GPT-5.3-Codex — от пользователей действий не требуется, но Enterprise-администраторам стоит проверить политики моделей.
Sculpt4D от Tencent ARC генерирует 4D-объекты из видео — на 56% дешевле полного внимания
Модель надстроена над Hunyuan3D 2.1 и уже открыта на Hugging Face — но время инференса и лицензия не раскрыты.
DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок
Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
GitHub Copilot запускает агентов на удалённых машинах — сессия не умирает при отключении
Плюс BYOK в изолированных сетях, оценка риска команд и синхронизация истории между устройствами.
Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes
В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.
Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput
Together AI раскрыла инженерные решения, позволившие обслуживать MiniMax M3 (1M токенов, нативная мультимодальность, MSA-архитектура) с приростом throughput 81–125% на разных уровнях конкурентности. Это первый публичный…
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
GitHub Copilot Code Review теперь тянет контекст из MCP-серверов и считает кредиты за глубину анализа
На Microsoft Build 2026 GitHub выкатил два обновления Copilot, которые вместе сдвигают инструмент от «умного автодополнения» к агентному слою в CI/CD: code review научился ходить в MCP-серверы за контекстом, а за более…
Holo3.1: computer-use агент теперь работает локально и на мобильных
Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…
GitHub Copilot перешёл на токен-биллинг: платишь за то, что потребил
GitHub полностью переключил Copilot на usage-based billing через AI Credits (1 кредит = $0.01). Это меняет экономику инструмента для всех — от студентов до enterprise-команд: вместо фиксированной подписки расходы теперь…
Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков
JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.
Что нового в Microsoft 365 Copilot | Май 2026
Microsoft 365 Copilot получил новые модели Claude Opus 4.8 и GPT-5.5 Instant, обновлённый дизайн и интеграцию с Apple CarPlay; также представлены расширенные метрики использования AI и инструменты для разработчиков.
Выпущен smolagents v1.26.0
В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.
Together AI: как построить рекордно быстрый Speech-to-Text стек
Together AI представила детальное техническое описание оптимизации всего стека преобразования речи в текст, включая GPU, CPU, память и сетевые протоколы, установив новый мировой рекорд скорости.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.