Новости AI-стека
Daily · свежие материалы
GitHub Copilot запускает агентов на удалённых машинах — сессия не умирает при отключении
Плюс BYOK в изолированных сетях, оценка риска команд и синхронизация истории между устройствами.
Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes
В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.
Runway расследует повышенный уровень ошибок в Seedance и Seedream
Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.
Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди
100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.
Cohere Labs запускает бенчмарк культурных загадок и ищет экспертов со всего мира
Параллельно — дискуссия о том, нужен ли агентам «язык чувств» для координации.
Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам
Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
GitHub Copilot Code Review теперь тянет контекст из MCP-серверов и считает кредиты за глубину анализа
На Microsoft Build 2026 GitHub выкатил два обновления Copilot, которые вместе сдвигают инструмент от «умного автодополнения» к агентному слою в CI/CD: code review научился ходить в MCP-серверы за контекстом, а за более…
Holo3.1: computer-use агент теперь работает локально и на мобильных
Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…
Runway вложит $100 млн в лондонский хаб по world models
$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…
GitHub Copilot перешёл на токен-биллинг: платишь за то, что потребил
GitHub полностью переключил Copilot на usage-based billing через AI Credits (1 кредит = $0.01). Это меняет экономику инструмента для всех — от студентов до enterprise-команд: вместо фиксированной подписки расходы теперь…
Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков
JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.
Gemini 2.0 Flash отключён — что ставить вместо него
1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…
Quick BI против галлюцинирующих агентов: почему данные важнее модели
На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…
Cohere Labs идёт на хакатон Hugging Face со своими малыми моделями
Cohere Labs поддержала хакатон «Build. Small.» от Hugging Face и Gradio, назвав Tiny Aya и Cohere Transcribe рекомендованными моделями для участников. Это первое явное позиционирование компании в нише компактных моделей…
Что нового в Microsoft 365 Copilot | Май 2026
Microsoft 365 Copilot получил новые модели Claude Opus 4.8 и GPT-5.5 Instant, обновлённый дизайн и интеграцию с Apple CarPlay; также представлены расширенные метрики использования AI и инструменты для разработчиков.
Выпущен smolagents v1.26.0
В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.
Cohere Labs анонсирует новое исследование Self-Verified RL с использованием Soft-Rewards
Модель Command A+ превзошла конкурентов в машинном переводе, параллельно компания представила новаторское исследование Soft-SVeRL.
happyhorse: генерация видео с контролем длительности и формата
HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Qwen-VLA: От осмысления к активному вмешательству в реальный мир
Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.
Seedance 2.0 теперь доступен через API Runway
Модель Seedance 2.0, разработанная сторонней командой, теперь доступна через API Runway, предлагая расширенные функции для генерации видео из различных типов данных.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Data Formulator 0.7: анализ данных предприятий с помощью ИИ
Microsoft Research представила открытую систему Data Formulator 0.7 для анализа корпоративных данных, одновременно интегрировав модель Claude Opus 4.8 от Anthropic в свои платформы Microsoft 365 Copilot и Foundry.
Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI
Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.
Сообщение от Ивана Чжана (сооснователя и технического директора Cohere)
Неофициальный пост в X (ранее Twitter) от сооснователя и технического директора Cohere Ивана Чжана, содержащий краткое личное сообщение.
Gemini Image Models: видео в картинку, но не для всех
Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.
qwen-cloud: облако, где агенты говорят на одном языке
Alibaba Cloud представила Qwen Cloud 26 мая в Сингапуре, создав AI-нативную платформу для работы с агентами и мультимодальными моделями.
Cohere: «Языковое замешательство» скрывает пробелы в безопасности многоязычных моделей
Новое исследование Cohere Labs выявило, что бинарные системы оценки безопасности не способны адекватно реагировать на «языковое замешательство» в многоязычных ИИ-моделях, делая их ложно безопасными.
Finance Agent в Microsoft 365 Copilot: новые функции чата и эталон оценки ИИ для финансовой сферы
Microsoft представила общедоступную предварительную версию новых функций чата и домашнего рабочего пространства для Finance Agent, а также специализированный бенчмарк для оценки ИИ-решений в финансовом секторе.