Новости AI-стека
Daily · свежие материалы
Meta бесплатно раздаст Ray-Ban AI-очки 130 000 слепым ветеранам США
Аналогичные устройства конкурентов стоят до $5 000 — здесь цена для ветерана равна нулю.
Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним
Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.
Meta арендует у Reliance дата-центр на 168 МВт — первый ИИ-объект компании в Индии
Плюс почти 1 ГВт новых контрактов на возобновляемую энергию — инфраструктурный и энергетический вопрос закрыты разом.
ElevenLabs открыл API для разработчиков по всему миру — Grab уже тестирует
Географических ограничений больше нет — и первый публичный кейс пришёл из Юго-Восточной Азии.
Один API-запрос — и агент ElevenLabs сам снял видео
Агент исследует тему, пишет HTML/CSS и рендерит MP4 через HyperFrames — без ручного монтажа.
Meta вложила $115 млн в обучение электриков и сварщиков — с гарантией трудоустройства
Программа покрывает все расходы участников: учёбу, перелёт, жильё и суточные — без студенческих долгов.
Veo 3.1 на Runway перестал генерировать видео
Движок принадлежит Google — Runway только ждёт, пока там починят.
ElevenLabs показала, как создать приложение голосом
Вы голосом описываете, что хотите, — а система сама собирает готовое приложение под ваш запрос.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Meta Business Agent: AI-агент для бизнеса уже на WhatsApp и Instagram
Старт бесплатный, но в ближайшие месяцы — платная подписка; более 1 млн бизнесов уже используют раннюю версию.
Runway расследует повышенный уровень ошибок в Seedance и Seedream
Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.
Reachy Mini заговорил без облака: Parakeet + Gemma 4 E4B + Qwen3TTS на борту
Как три open-source модели складываются в полный голосовой цикл на $300 роботе.
Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам
Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.
Runway вложит $100 млн в лондонский хаб по world models
$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…
@thorwebdev (Thorsten Schaeff, руководитель отдела по работе с разработчиками): Удивительно, насколько хорошо Gemini Omni справляется с отражениями 🤯
Торстен Шефф, руководитель отдела по работе с разработчиками ElevenLabs, отметил в своем посте X впечатляющую способность Gemini Omni обрабатывать отражения.
happyhorse: генерация видео с контролем длительности и формата
HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.
Seedance 2.0 теперь доступен через API Runway
Модель Seedance 2.0, разработанная сторонней командой, теперь доступна через API Runway, предлагая расширенные функции для генерации видео из различных типов данных.
Глава отдела по работе с разработчиками ElevenLabs Торстен Шефф разрабатывает ИИ-помощника для формирования составов команд на лодках-аутригерах, используя Gemini 3.5 Flash.
Торстен Шефф разрабатывает прототип решения для формирования команд на аутригерах прямо во время полета, демонстрируя потенциал быстрой разработки с агентивными ИИ-инструментами.
Gemini 3.5 Flash: помощник для каноэ — за один перелет
Разработчик Google Торстен Шафф приступил к созданию ИИ-помощника для гребли на каноэ с помощью Gemini 3.5 Flash и Antigravity прямо на борту самолета.
Runway Seedance: инцидент с генерациями быстро устранен
На платформе Runway 27 мая 2026 года произошел кратковременный инцидент с генерациями Seedance, который был устранен за 33 минуты.
Project Luxo: AI-видео перестает быть демонстрацией технологий и начинает рассказывать истории
Runway ML утверждает, что модель Aleph 2.0 позволила AI-генерированному видео преодолеть "зловещую долину" и фокусироваться на эмоциональном повествовании.
Runway: Сбои в генерации GPT Image 2 устранены, но Veo 3.1 пока нестабилен
Платформа Runway оперативно решила проблемы с генерацией изображений GPT Image 2, однако сбои в работе Veo 3.1 также были зафиксированы и устранены.
ElevenLabs на Google I/O: «разговор» с базой знаний и агенты в облаке
Торстен Шефф, руководитель отдела по работе с разработчиками ElevenLabs, активно участвовал в конференции Google I/O. Он продемонстрировал возможности интеграции multimodal-file-search и vision-agents для создания…
ElevenLabs: намек на Google I/O и «прогретые TPU»
ElevenLabs, известная своими технологиями синтеза речи, через своего руководителя по работе с разработчиками Торстена Шеффа сделала загадочный анонс в X, подогревая интерес к предстоящему мероприятию Google I/O…
Stable Audio 3: открытая модель для музыки и звуков с инпейнтингом
Stability AI выпустила Stable Audio 3 — новую открытую модель для генерации и редактирования аудио. Эта модель представляет собой семейство быстрых латентных диффузионных моделей, способных создавать аудио переменной…
Взгляд изнутри ElevenLabs
Сегодняшний день не принес крупных анонсов или обновлений от ElevenLabs. Вместо этого, фокус сместился на внутренние события и личные наблюдения сотрудников, что дает редкую возможность заглянуть за кулисы повседневной…
Stability AI: Как новый автоэнкодер SAME ускоряет генерацию аудио в Stable Audio 3
Stability AI представила SAME (Semantically-Aligned Music Autoencoder) — открытый автоэнкодер, который призван изменить подходы к работе с музыкальными и общими аудиоданными. Его основная задача — эффективное сжатие…
Business AI в WhatsApp: Meta дает ИИ-помощников для малого бизнеса — но пока только в Индии
Meta запустила в Индии функцию Business AI для WhatsApp Business App, предлагая малому бизнесу автоматизированные ответы на запросы клиентов и управление продажами прямо в приложении. Это решение, доступное на всех…
Runway Agent: видео целиком за один диалог
Runway представила Runway Agent, креативного ИИ-партнера, который призван упростить процесс создания готового к публикации видеоконтента. От первоначальной идеи до финального ролика с несколькими сценами, озвучкой и…
ElevenLabs: Детализация SIP-звонков, API для RAG-чанков и новые LLM в обновлении 13 мая
ElevenLabs выпустила набор обновлений, затрагивающих как инструментарий для работы с агентами, так и базовые API. Среди наиболее заметных изменений — появление детализированных SIP-логов для отладки, новый API для…