AI/News — anthropic ecosystem newsroom

Daily · свежие материалы

хронологический список

18 ИЮН

Daily · ElevenLabs · X · ElevenLabs · TG #547

Gemini 3.5 Live Translate переводит голос в реальном времени на 70+ языков

Без очерёдности реплик и без поддержки инструментов — чистый переводчик-поток, не ассистент.

1 мин

18 ИЮН

Daily · Runway · Runway · TG #545

Runway добавил встроенный монтаж — резать и склеивать видео теперь прямо там

Раньше для финальной сборки приходилось уходить в сторонний редактор — теперь обрезка, переупорядочивание и экспорт внутри одной платформы.

1 мин

17 ИЮН

Daily · ElevenLabs · X · ElevenLabs · TG #536

Gemini Live Translate перевёл голос футбольного комментатора — с эмоциями

VisionAgents.ai показала демо: детектор следит за мячом, Gemini комментирует и переводит, не теряя накала.

1 мин

17 ИЮН

Daily · Deepgram · Deepgram · TG #530

Deepgram открыл австралийский эндпоинт — данные не покидают страну

Один URL вместо self-hosted: те же ключи, те же цены — и аудио остаётся в Австралии.

1 мин

17 ИЮН

Daily · Black Forest Labs · Black Forest Labs · TG #529

Envato сгенерировала 51 млн изображений через FLUX — и запустила FLUX.2 в первый день релиза

FLUX.2 загружают на 16% чаще среднего по платформе — и он обгоняет конкурентов на 10% в фотореалистичных сценах.

1 мин

17 ИЮН

Daily · Google · Google · TG #525

Gemini 3.1 Flash TTS отдаёт аудио потоком, не дожидаясь конца генерации

Управление темпом, акцентом и тоном через промпт остаётся — задержка до первого байта падает.

1 мин

16 ИЮН

Daily · Google · Google · TG #522

Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство

Прототип на Gemini берёт на себя сбор данных и черновик решения — чиновник остаётся финальным арбитром.

2 мин

15 ИЮН

Daily · Google · Google · TG #517

Veo 2.0 и 3.0 отключат 30 июня — до дедлайна две недели

Imagen 4 уходит в августе, а единственная замена для Veo — модели в статусе preview, не GA.

1 мин

11 ИЮН

Daily · Runway · Runway · TG #499

Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним

Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.

1 мин

10 ИЮН

Daily · Deepgram · Deepgram · TG #492

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.

1 мин

10 ИЮН

Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин

09 ИЮН

Daily · ElevenLabs · X · ElevenLabs · TG #485

ElevenLabs открыл API для разработчиков по всему миру — Grab уже тестирует

Географических ограничений больше нет — и первый публичный кейс пришёл из Юго-Восточной Азии.

1 мин

09 ИЮН

Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин

08 ИЮН

Daily · ElevenLabs · X · ElevenLabs · TG #475

Один API-запрос — и агент ElevenLabs сам снял видео

Агент исследует тему, пишет HTML/CSS и рендерит MP4 через HyperFrames — без ручного монтажа.

1 мин

04 ИЮН

Daily · Runway · Runway · TG #448

Veo 3.1 на Runway перестал генерировать видео

Движок принадлежит Google — Runway только ждёт, пока там починят.

1 мин

04 ИЮН

Daily · Black Forest Labs · Black Forest Labs · TG #446

FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки

Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.

1 мин

03 ИЮН

Daily · ElevenLabs · X · ElevenLabs · TG #444

ElevenLabs показала, как создать приложение голосом

Вы голосом описываете, что хотите, — а система сама собирает готовое приложение под ваш запрос.

1 мин

03 ИЮН

Daily · Stability AI · Stability AI · TG #441

Stability AI нашла способ экономить память при длинных текстах и видео

Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.

1 мин

03 ИЮН

Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

1 мин

03 ИЮН

Daily · Runway · Runway

Runway расследует повышенный уровень ошибок в Seedance и Seedream

Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.

1 мин

02 ИЮН

Daily · ElevenLabs · X · ElevenLabs

Reachy Mini заговорил без облака: Parakeet + Gemma 4 E4B + Qwen3TTS на борту

Как три open-source модели складываются в полный голосовой цикл на $300 роботе.

1 мин

02 ИЮН

Daily · Together AI · Together AI

Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput

Together AI раскрыла инженерные решения, позволившие обслуживать MiniMax M3 (1M токенов, нативная мультимодальность, MSA-архитектура) с приростом throughput 81–125% на разных уровнях конкурентности. Это первый публичный…

2 мин

02 ИЮН

Daily · Runway · Runway

Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам

Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.

1 мин

02 ИЮН

Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

1 мин

01 ИЮН

Daily · Runway · Runway

Runway вложит $100 млн в лондонский хаб по world models

$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…

1 мин

01 ИЮН

Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

1 мин

29 МАЯ

Daily · ElevenLabs · X · ElevenLabs

@thorwebdev (Thorsten Schaeff, руководитель отдела по работе с разработчиками): Удивительно, насколько хорошо Gemini Omni справляется с отражениями 🤯

Торстен Шефф, руководитель отдела по работе с разработчиками ElevenLabs, отметил в своем посте X впечатляющую способность Gemini Omni обрабатывать отражения.

1 мин

29 МАЯ

Daily · Together AI · Together AI

Together AI: как построить рекордно быстрый Speech-to-Text стек

Together AI представила детальное техническое описание оптимизации всего стека преобразования речи в текст, включая GPU, CPU, память и сетевые протоколы, установив новый мировой рекорд скорости.

8 мин

29 МАЯ

Daily · Runway · Runway

happyhorse: генерация видео с контролем длительности и формата

HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.

6 мин

29 МАЯ

Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин

Новости AI-стека

Daily · свежие материалы

Gemini 3.5 Live Translate переводит голос в реальном времени на 70+ языков

Runway добавил встроенный монтаж — резать и склеивать видео теперь прямо там

Gemini Live Translate перевёл голос футбольного комментатора — с эмоциями

Deepgram открыл австралийский эндпоинт — данные не покидают страну

Envato сгенерировала 51 млн изображений через FLUX — и запустила FLUX.2 в первый день релиза

Gemini 3.1 Flash TTS отдаёт аудио потоком, не дожидаясь конца генерации

Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство

Veo 2.0 и 3.0 отключат 30 июня — до дедлайна две недели

Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

ElevenLabs открыл API для разработчиков по всему миру — Grab уже тестирует

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Один API-запрос — и агент ElevenLabs сам снял видео

Veo 3.1 на Runway перестал генерировать видео

FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки

ElevenLabs показала, как создать приложение голосом

Stability AI нашла способ экономить память при длинных текстах и видео

Replicate устранил очереди и задержки на кластерах L40S и H200

Runway расследует повышенный уровень ошибок в Seedance и Seedream

Reachy Mini заговорил без облака: Parakeet + Gemma 4 E4B + Qwen3TTS на борту

Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput

Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

Runway вложит $100 млн в лондонский хаб по world models

Gemini 2.0 Flash отключён — что ставить вместо него

@thorwebdev (Thorsten Schaeff, руководитель отдела по работе с разработчиками): Удивительно, насколько хорошо Gemini Omni справляется с отражениями 🤯

Together AI: как построить рекордно быстрый Speech-to-Text стек

happyhorse: генерация видео с контролем длительности и формата

Cog: потоки событий для предсказаний и новые предупреждения

Замечания по сайту