Новости AI-стека

Daily · ElevenLabs · X · ElevenLabs · TG #536

Gemini Live Translate перевёл голос футбольного комментатора — с эмоциями

VisionAgents.ai показала демо: детектор следит за мячом, Gemini комментирует и переводит, не теряя накала.

Daily · Black Forest Labs · Black Forest Labs · TG #529

Envato сгенерировала 51 млн изображений через FLUX — и запустила FLUX.2 в первый день релиза

FLUX.2 загружают на 16% чаще среднего по платформе — и он обгоняет конкурентов на 10% в фотореалистичных сценах.

Daily · Google · Google · TG #525

Gemini 3.1 Flash TTS отдаёт аудио потоком, не дожидаясь конца генерации

Управление темпом, акцентом и тоном через промпт остаётся — задержка до первого байта падает.

Daily · Alibaba · Alibaba · TG #524

Qwen-Robot Suite: Alibaba научила языковые модели управлять роботами

Три модели — навигация, манипуляция, симуляция мира — обучены только на открытых данных и уже тестируются у корпоративных клиентов.

Daily · Google · Google · TG #522

16 ИЮН

Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство

Прототип на Gemini берёт на себя сбор данных и черновик решения — чиновник остаётся финальным арбитром.

Daily · Google · Google · TG #517

15 ИЮН

Veo 2.0 и 3.0 отключат 30 июня — до дедлайна две недели

Imagen 4 уходит в августе, а единственная замена для Veo — модели в статусе preview, не GA.

Daily · Alibaba · Alibaba · TG #511

15 ИЮН

Qwen Cloud: облачную платформу читают агенты, а не люди

Один API-ключ на шесть модальностей и фиксированная подписка вместо непредсказуемого pay-as-you-go — и флагман вдвое дешевле, чем на Model Studio.

Daily · Runway · Runway · TG #499

11 ИЮН

Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним

Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.

Daily · Google · Google · TG #489

10 ИЮН

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

Daily · ElevenLabs · X · ElevenLabs · TG #485

09 ИЮН

ElevenLabs открыл API для разработчиков по всему миру — Grab уже тестирует

Географических ограничений больше нет — и первый публичный кейс пришёл из Юго-Восточной Азии.

Daily · Google · Google · TG #477

09 ИЮН

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

Daily · ElevenLabs · X · ElevenLabs · TG #475

08 ИЮН

Один API-запрос — и агент ElevenLabs сам снял видео

Агент исследует тему, пишет HTML/CSS и рендерит MP4 через HyperFrames — без ручного монтажа.

Daily · Alibaba · Alibaba · TG #465

08 ИЮН

Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле

Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.

Daily · Runway · Runway · TG #448

04 ИЮН

Veo 3.1 на Runway перестал генерировать видео

Движок принадлежит Google — Runway только ждёт, пока там починят.

Daily · Black Forest Labs · Black Forest Labs · TG #446

04 ИЮН

FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки

Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.

Daily · ElevenLabs · X · ElevenLabs · TG #444

ElevenLabs показала, как создать приложение голосом

Вы голосом описываете, что хотите, — а система сама собирает готовое приложение под ваш запрос.

Daily · Stability AI · Stability AI · TG #441

Stability AI нашла способ экономить память при длинных текстах и видео

Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.

Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

Runway расследует повышенный уровень ошибок в Seedance и Seedream

Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.

Daily · Alibaba · Alibaba

Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди

100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.

Daily · ElevenLabs · X · ElevenLabs

02 ИЮН

Reachy Mini заговорил без облака: Parakeet + Gemma 4 E4B + Qwen3TTS на борту

Как три open-source модели складываются в полный голосовой цикл на $300 роботе.

02 ИЮН

Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам

Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.

Daily · Replicate · Replicate

02 ИЮН

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

01 ИЮН

Runway вложит $100 млн в лондонский хаб по world models

$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…

01 ИЮН

Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

Daily · Alibaba · Alibaba

01 ИЮН

Quick BI против галлюцинирующих агентов: почему данные важнее модели

На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…

Daily · ElevenLabs · X · ElevenLabs

@thorwebdev (Thorsten Schaeff, руководитель отдела по работе с разработчиками): Удивительно, насколько хорошо Gemini Omni справляется с отражениями 🤯

Торстен Шефф, руководитель отдела по работе с разработчиками ElevenLabs, отметил в своем посте X впечатляющую способность Gemini Omni обрабатывать отражения.

happyhorse: генерация видео с контролем длительности и формата

HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.

6 мин

Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин