AI News Watcher
Tuesday, Jun 30, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jun 30, 2026 · 1 min read · Runway ← Back to feed

Runway Seed Audio 1.0: делает звуки по тексту — и подбирает стиль по образцу daily

До 120 секунд звука по тексту, стиль — по 30-секундному образцу.

Runway Seed Audio 1.0: делает звуки по тексту — и подбирает стиль по образцу
Редакция · Daily briefing

Полностью контролировать стиль и настроение генерируемого аудио до сих пор было сложно: модели обычно создавали звук по тексту, но без тонкой настройки. Теперь Runway предлагает API Seed Audio 1.0, который позволяет задавать тон вывода через аудио-образцы. Это шаг к созданию более связных и выразительных аудио-сцен.

API Seed Audio 1.0 позволяет генерировать как речь, так и различные звуковые эффекты, используя текстовые описания. Главное отличие — возможность предоставить аудио-ссылку до 30 секунд. Этот образец задаёт стиль, тон или настроение для генерируемого вывода, помогая добиться желаемого звучания.

Модель способна создать до 120 секунд аудио. Результат можно получить в форматах WAV, MP3 и Ogg Opus. Стоимость генерации составляет 0.25 кредита в секунду, с минимальной ценой за вызов в 5 кредитов. Для работы доступны отдельные конечные точки для text to speech и sound effect.

Конкуренты, такие как Meta AudioGen, также предлагают генерацию звуков по тексту, но с ограничением в 5 секунд и без явной опции использования аудио-образцов для стилизации. ElevenLabs, в свою очередь, фокусируется на генерации звуковых эффектов по другой ценовой модели ($0.12 за генерацию), но также не упоминает о референсных аудио. Это подчёркивает новизну подхода Runway в части контроля над стилем.

Runway, известная своими возможностями в работе с видео, теперь расширяет мультимодальный инструментарий на аудио. Возможность задавать тон генерации через аудио-образцы может стать ключевой для разработчиков, которым нужна не просто генерация, а когерентное звучание в сложных сценах. Остаётся оценить, насколько эффективно модель интерпретирует референсные аудио в реальных проектах.

Дополнительные источники

  1. AudioGen: Textually-Guided Audio Generation
  2. Open sourcing AudioCraft: Generative AI for audio made simple and available to all
  3. ElevenLabs Pricing for creators and businesses of all sizes
  4. ElevenLabs Text to Speech | ElevenLabs Documentation
  5. actuia.com
  6. aipricing.guru

Источники

  1. https://docs.dev.runwayml.com/api-details/api_changelog/ external
→ Опубликовано в Telegram: @agentic_ai_news/608