О чём эта новость
Компания fal объявила о запуске API-доступа к HappyHorse 1.0 — передовой модели для генерации видео с искусственным интеллектом, разработанной Alibaba. Этот релиз, состоявшийся 27 апреля 2026 года, предоставляет разработчикам расширенный контроль над создаваемым контентом, включая возможность тонкой настройки длительности видео и разнообразных форматов, что отличает её от многих существующих решений. Запуск через fal делает эту мощную модель немедленно доступной для широкого круга пользователей, стремящихся к высококачественной и управляемой генерации видео.
Представление HappyHorse 1.0 и его запуск
HappyHorse 1.0 — это передовая модель для генерации видео с искусственным интеллектом, разработанная Alibaba Token Hub Business Group. Эта модель способна создавать физически убедительные симуляции с глубоким пониманием семантики и следованием инструкциям, а также обладает исключительными возможностями эстетического выражения.
Разработка HappyHorse 1.0 велась внутри инновационного подразделения ATH компании Alibaba, и изначально проект находился на стадии закрытого бета-тестирования. Модель позиционируется как первый открытый исходный код видеомодели, способной нативно генерировать аудио и видео одновременно.
Официальным партнером по API, запустившим доступ к HappyHorse 1.0, стала компания fal. fal открыла API-доступ для разработчиков и корпоративных клиентов 27 апреля 2026 года, сделав модель мгновенно доступной через свою платформу генеративных медиа. Этот запуск через fal позволил решить проблему ограниченного доступа, который существовал в период частного бета-тестирования, и предоставил разработчикам SDK на Python и JavaScript для упрощения интеграции.
Таким образом, HappyHorse 1.0, будучи продуктом Alibaba, стал доступен широкой аудитории благодаря партнерству с fal, которая выступает в качестве ключевого моста между разработчиком модели и конечными пользователями, нуждающимися в мощных инструментах для генерации видео.
Ключевые возможности и технические особенности HappyHorse 1.0
HappyHorse 1.0 выделяется на рынке благодаря своим мультимодальным входным возможностям, поддерживая генерацию видео из текста (text-to-video), изображений (image-to-video), а также создание видео на основе референсных материалов (reference-to-video) и редактирование уже существующих видео (video-edit). Это обеспечивает гибкие творческие рабочие процессы, позволяя пользователям начинать с различных типов исходных данных.
Одной из наиболее значимых особенностей модели является её способность к аудиовизуальной синхронизации и многокадровой последовательности. В отличие от многих других моделей, которые генерируют только бесшумное видео, API fal для HappyHorse 1.0 предоставляет полноценные мультимодальные возможности, включая синхронизацию губ и звуковые эффекты (Foley sounds). Это достигается за счет архитектуры Unified Transformer, которая позволяет обрабатывать аудио и видео в рамках одного прохода генерации, что отличает её от конвейерных методов других моделей.
Модель также предлагает гибкие параметры разрешения и формата видео. Пользователи могут выбирать между разрешениями 720p или 1080p, а также использовать различные соотношения сторон, такие как 16:9, 9:16, 1:1, 4:3 и 3:4. Это обеспечивает совместимость контента с широким спектром социальных платформ и других медиаресурсов. В источниках нет подробных данных о длительности видео, но подразумевается, что она варьируется в пределах 5-10 секунд для 1080p.
HappyHorse 1.0 является проектом с полностью открытым исходным кодом, что предоставляет разработчикам беспрецедентный уровень прозрачности и возможность для дальнейшей кастомизации и интеграции. Такая открытость способствует развитию экосистемы вокруг модели и позволяет сообществу вносить свой вклад. Открытость исходного кода также предполагает возможность самохостинга, что в теории может обеспечить бесплатное использование. Однако информация о ценах на API HappyHorse 1.0 не указана в источниках, равно как и подробные условия коммерческих прав на сгенерированный контент — хотя fal заявляет о гарантии полных коммерческих прав для всех сгенерированных материалов через их API, детали лицензирования самой модели Alibaba не приводятся.
Позиционирование на рынке и сравнение с конкурентами
HappyHorse 1.0 уверенно занимает лидирующие позиции на рынке ИИ-генерации видео, что подтверждается рейтингами на бенчмарках Artificial Analysis. В начале апреля 2026 года модель возглавила четыре категории в таблице лидеров, значительно превзойдя Seedance 2.0 от ByteDance и Kling. В слепых тестах пользователи подавляюще отдавали предпочтение HappyHorse 1.0, о чем свидетельствует разница в 111 баллов Elo в категории «Текст в видео без аудио» (1384 Elo против 1273 у Seedance 2.0).
При сравнении с Seedance 2.0, HappyHorse 1.0 отличается своей открытой архитектурой Unified Transformer и возможностью одновременной генерации аудио и видео за один проход, в то время как Seedance 2.0 использует закрытую архитектуру Bidirectional Diffusion Transformer и конвейерный подход. Хотя по качеству аудио HappyHorse 1.0 находится примерно на одном уровне с Seedance 2.0, в других аспектах она демонстрирует превосходство. В источниках нет примеров использования или отзывов от первых пользователей HappyHorse 1.0, что могло бы дополнительно проиллюстрировать эти преимущества.
По сравнению с Runway Gen-3 Alpha, HappyHorse 1.0 также демонстрирует значительное превосходство. По данным Artificial Analysis, HappyHorse 1.0 опережает Runway Gen-3 Alpha по всем показателям качества: «Текст в видео» (1333 против 1180), «Изображение в видео» (1392 против 1200) и «Аудио» (1205 против 1080). Кроме того, HappyHorse 1.0 работает в 4,5 раза быстрее и поддерживает синхронизацию аудио, чего не предлагает Runway. Однако Runway Gen-3 Alpha имеет более зрелые инструменты редактирования и профессиональные интеграции в рабочие процессы, что может быть важно для некоторых пользователей, несмотря на более высокую стоимость и закрытый исходный код.
Последние обновления RunwayML и конкурентная среда
Пока HappyHorse 1.0 устанавливает новые стандарты в области генерации видео, другие игроки рынка, такие как RunwayML, также продолжают развивать свои предложения. RunwayML регулярно обновляет свой API, добавляя новые модели и функции. Среди последних обновлений — появление Gemini 3 Pro Image (Nano Banana Pro) 30 апреля 2026 года, которая позволяет генерировать изображения с промптами до 5500 символов и до 14 референсных изображений в разрешениях 1K, 2K или 4K. Также 23 апреля 2026 года стала доступна OpenAI GPT Image 2 с поддержкой до 16 референсных изображений и различным ценообразованием.
В части видеогенерации, RunwayML также предлагает улучшения. Gen-4.5 стал доступен через API 10 февраля 2026 года, обеспечивая более высокое качество видео из текста или изображений с длительностью от 2 до 10 секунд. Кроме того, 8 октября 2025 года RunwayML представила гибкую продолжительность генерации для своих видеомоделей, таких как Gen-4 Turbo, позволяя выбирать любую длительность в диапазоне от 2 до 10 секунд и платить только за фактически сгенерированное время. API RunwayML также включает интеграции со сторонними сервисами, например, для изоляции голоса и дублирования от ElevenLabs, а также Google Veo 3.1 для улучшения генерации текста в изображение и изображения в видео с поддержкой первого и последнего ключевого кадра и выходом 1080p.
Что это значит
HappyHorse 1.0 от fal, разработанный Alibaba, выпущен с открытым исходным кодом. Он демонстрирует производительность на бенчмарках и позиционируется с акцентом на контроль над контентом и мультимодальность. Открытый исходный код действительно может повлиять на скорость внедрения таких решений в проектах, которым критичны эти особенности.