Новости AI-стека
Daily · свежие материалы
GitHub Agentic Workflows вышел в публичный доступ — агенты на Markdown без PAT
Автоматизация описывается на естественном языке и компилируется в Actions YAML — а AI-кредиты идут напрямую на счёт организации.
Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним
Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
GitHub Copilot CLI теперь ищет уязвимости прямо в терминале
Команда /security-review работает независимо от Code Scanning и Dependabot — как отдельный, более ранний рубеж защиты.
GitHub проверяет код от Claude и Codex так же, как от Copilot
Три слоя защиты — CodeQL, проверка зависимостей и сканирование секретов — без лицензии Advanced Security.
Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке
Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.
Microsoft Foundry даёт агентам память между сессиями — без внешней базы данных
Состояние хранится в изолированной microVM на сервере; клиент знает только session id.
Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле
Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.
GPT-5.2 и GPT-5.2-Codex убраны из GitHub Copilot
Chat, автодополнение и agent-режим перешли на GPT-5.5 и GPT-5.3-Codex — от пользователей действий не требуется, но Enterprise-администраторам стоит проверить политики моделей.
Sculpt4D от Tencent ARC генерирует 4D-объекты из видео — на 56% дешевле полного внимания
Модель надстроена над Hunyuan3D 2.1 и уже открыта на Hugging Face — но время инференса и лицензия не раскрыты.
Veo 3.1 на Runway перестал генерировать видео
Движок принадлежит Google — Runway только ждёт, пока там починят.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
GitHub Copilot запускает агентов на удалённых машинах — сессия не умирает при отключении
Плюс BYOK в изолированных сетях, оценка риска команд и синхронизация истории между устройствами.
Runway расследует повышенный уровень ошибок в Seedance и Seedream
Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.
Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди
100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.
Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам
Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
GitHub Copilot Code Review теперь тянет контекст из MCP-серверов и считает кредиты за глубину анализа
На Microsoft Build 2026 GitHub выкатил два обновления Copilot, которые вместе сдвигают инструмент от «умного автодополнения» к агентному слою в CI/CD: code review научился ходить в MCP-серверы за контекстом, а за более…
Runway вложит $100 млн в лондонский хаб по world models
$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…
GitHub Copilot перешёл на токен-биллинг: платишь за то, что потребил
GitHub полностью переключил Copilot на usage-based billing через AI Credits (1 кредит = $0.01). Это меняет экономику инструмента для всех — от студентов до enterprise-команд: вместо фиксированной подписки расходы теперь…
Gemini 2.0 Flash отключён — что ставить вместо него
1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…
Quick BI против галлюцинирующих агентов: почему данные важнее модели
На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…
Что нового в Microsoft 365 Copilot | Май 2026
Microsoft 365 Copilot получил новые модели Claude Opus 4.8 и GPT-5.5 Instant, обновлённый дизайн и интеграцию с Apple CarPlay; также представлены расширенные метрики использования AI и инструменты для разработчиков.
happyhorse: генерация видео с контролем длительности и формата
HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Nova-3 Medical: точность в медицине растет, но что с остальным?
Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.
Qwen-VLA: От осмысления к активному вмешательству в реальный мир
Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.
Seedance 2.0 теперь доступен через API Runway
Модель Seedance 2.0, разработанная сторонней командой, теперь доступна через API Runway, предлагая расширенные функции для генерации видео из различных типов данных.