Новости AI-стека
Daily · свежие материалы
Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним
Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле
Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.
Veo 3.1 на Runway перестал генерировать видео
Движок принадлежит Google — Runway только ждёт, пока там починят.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Runway расследует повышенный уровень ошибок в Seedance и Seedream
Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.
Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди
100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.
Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам
Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.
Runway вложит $100 млн в лондонский хаб по world models
$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…
Quick BI против галлюцинирующих агентов: почему данные важнее модели
На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…
happyhorse: генерация видео с контролем длительности и формата
HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.
Nova-3 Medical: точность в медицине растет, но что с остальным?
Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.
Qwen-VLA: От осмысления к активному вмешательству в реальный мир
Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.
Seedance 2.0 теперь доступен через API Runway
Модель Seedance 2.0, разработанная сторонней командой, теперь доступна через API Runway, предлагая расширенные функции для генерации видео из различных типов данных.
Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским
Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.
qwen-cloud: облако, где агенты говорят на одном языке
Alibaba Cloud представила Qwen Cloud 26 мая в Сингапуре, создав AI-нативную платформу для работы с агентами и мультимодальными моделями.
Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать
Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.
Runway Seedance: инцидент с генерациями быстро устранен
На платформе Runway 27 мая 2026 года произошел кратковременный инцидент с генерациями Seedance, который был устранен за 33 минуты.
Alibaba Cloud: комплексная экосистема для агентного ИИ и глобального масштаба
На первой международной конференции Qwen в Сингапуре Alibaba Cloud представила новые модели, инфраструктуру и инструменты для построения и управления ИИ-агентами.
Project Luxo: AI-видео перестает быть демонстрацией технологий и начинает рассказывать истории
Runway ML утверждает, что модель Aleph 2.0 позволила AI-генерированному видео преодолеть "зловещую долину" и фокусироваться на эмоциональном повествовании.
Runway: Сбои в генерации GPT Image 2 устранены, но Veo 3.1 пока нестабилен
Платформа Runway оперативно решила проблемы с генерацией изображений GPT Image 2, однако сбои в работе Veo 3.1 также были зафиксированы и устранены.
qwen3: гибридные рассуждения и сотни миллионов загрузок
Alibaba представила Qwen3 — новое поколение своих открытых больших языковых моделей, вводя гибридные режимы рассуждений и расширяя возможности агентов и многоязычной поддержки.
qwen3.5-livetranslate-Flash: Переводит речь, видит контекст, клонирует голос
Alibaba выпустила qwen3.5-livetranslate-Flash, новейшую модель синхронного перевода, которая не просто слушает и переводит речь, но и понимает визуальный контекст. Эта многомодальная система, построенная на архитектуре…
Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать
Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…
Qwen3.7-Max: Модель для агентов и перевод, который видит
Alibaba представила две новые модели: Qwen3.7-Max, ориентированную на автономных агентов, и Qwen3.5-LiveTranslate-Flash, способную к синхронному переводу с учетом визуального контекста. Это развитие AI-возможностей…
Stable Audio 3: открытая модель для музыки и звуков с инпейнтингом
Stability AI выпустила Stable Audio 3 — новую открытую модель для генерации и редактирования аудио. Эта модель представляет собой семейство быстрых латентных диффузионных моделей, способных создавать аудио переменной…
Stability AI: Как новый автоэнкодер SAME ускоряет генерацию аудио в Stable Audio 3
Stability AI представила SAME (Semantically-Aligned Music Autoencoder) — открытый автоэнкодер, который призван изменить подходы к работе с музыкальными и общими аудиоданными. Его основная задача — эффективное сжатие…
Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках
Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…
Runway Agent: видео целиком за один диалог
Runway представила Runway Agent, креативного ИИ-партнера, который призван упростить процесс создания готового к публикации видеоконтента. От первоначальной идеи до финального ролика с несколькими сценами, озвучкой и…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…