Новости AI-стека
Daily · свежие материалы
Lionsgate купила долю в Runway и будет снимать сериалы вместе с ним
Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.
Sculpt4D от Tencent ARC генерирует 4D-объекты из видео — на 56% дешевле полного внимания
Модель надстроена над Hunyuan3D 2.1 и уже открыта на Hugging Face — но время инференса и лицензия не раскрыты.
Veo 3.1 на Runway перестал генерировать видео
Движок принадлежит Google — Runway только ждёт, пока там починят.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
Runway расследует повышенный уровень ошибок в Seedance и Seedream
Сбой бьёт по платным пользователям безлимитного плана, где эти модели — основной инструмент.
Aleph 2.0 вышел в Runway API: редактирование видео по тексту и ключевым кадрам
Runway открыл API-доступ к Aleph 2.0 — своей flagship-модели video-to-video, которая умеет менять только то, что просят, не трогая остальное. Теперь это можно встроить в продукт.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
Runway вложит $100 млн в лондонский хаб по world models
$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…
Recraft V4.1 Utility Pro стал самым высокорейтинговым моделью text-to-image за пределами Google и OpenAI
Recraft V4.1 Utility Pro заняла третье место в глобальном рейтинге Artificial Analysis Image Arena, став самой высокорейтинговой моделью text-to-image от независимой лаборатории.
happyhorse: генерация видео с контролем длительности и формата
HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Seedance 2.0 теперь доступен через API Runway
Модель Seedance 2.0, разработанная сторонней командой, теперь доступна через API Runway, предлагая расширенные функции для генерации видео из различных типов данных.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
FLUX VTO: виртуальная примерка в масштабе каталога
Black Forest Labs анонсировала FLUX VTO — новую технологию виртуальной примерки одежды, предназначенную для ритейлеров, которая обеспечивает высокую скорость, точность рендеринга и гибкость стилизации для больших…
Runway Seedance: инцидент с генерациями быстро устранен
На платформе Runway 27 мая 2026 года произошел кратковременный инцидент с генерациями Seedance, который был устранен за 33 минуты.
Project Luxo: AI-видео перестает быть демонстрацией технологий и начинает рассказывать истории
Runway ML утверждает, что модель Aleph 2.0 позволила AI-генерированному видео преодолеть "зловещую долину" и фокусироваться на эмоциональном повествовании.
Runway: Сбои в генерации GPT Image 2 устранены, но Veo 3.1 пока нестабилен
Платформа Runway оперативно решила проблемы с генерацией изображений GPT Image 2, однако сбои в работе Veo 3.1 также были зафиксированы и устранены.
DeepSeek-V4-Pro: дисконт, ставший бессрочным
DeepSeek объявила, что скидка на использование модели DeepSeek-V4-Pro теперь действует постоянно. Это не временная акция, а фундаментальное изменение в ценовой политике, позволяющее разработчикам с большей уверенностью…
FLUX Outpainting: ИИ-расширение изображений в один API-вызов, без промтов
Black Forest Labs представила новую возможность для своей линейки FLUX Tools — FLUX Outpainting. Инструмент позволяет расширять любое изображение за его исходные границы, автоматически сохраняя при этом целостность…
Recraft V4.1: Фотореализм стал естественнее, промты — короче
Recraft представил V4.1 — обновление своей модели, которое меняет подход к генерации изображений. Теперь фотореализм выглядит более живым и естественным, а для достижения желаемой эстетики требуются заметно более…
StereoCrafter2: Tencent ARC Lab обновила модель для иммерсивного видео
Tencent ARC Lab выпустила обновление своей модели StereoCrafter, получившее название StereoCrafter2. Новая версия нацелена на решение ключевой проблемы в производстве иммерсивного видео: достижение высокой точности и…
Runway Agent: видео целиком за один диалог
Runway представила Runway Agent, креативного ИИ-партнера, который призван упростить процесс создания готового к публикации видеоконтента. От первоначальной идеи до финального ролика с несколькими сценами, озвучкой и…
Hy-MT2: многоязычный перевод для сложных сценариев — с оптимизацией для устройств
Tencent Hunyuan выпустила семейство многоязычных моделей перевода Hy-MT2, разработанных для сложных реальных сценариев. Модели доступны в размерах 1.8B, 7B и 30B-A3B (MoE), поддерживают 33 языка и демонстрируют…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Pixal3D-D от Tencent: 3D-модель представлена без документации
Tencent ARC Lab представила Pixal3D-D — новую модель для 3D-генерации, которая появилась на Hugging Face. Однако, несмотря на релиз, публичной документации или детального описания, как это часто бывает, пока нет.
Gemini 3 Pro Image: когда промпт — это полотно, а референсов полдюжины
Runway выпустил новую модель для генерации изображений — Gemini 3 Pro Image. Она же Nano Banana Pro, или gemini_image3_pro в API. Модель заточена под детализированные текстовые запросы и множество референсных…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
DeepSeek: V4-модели с контекстом 1M токенов и деприкация старых API
DeepSeek обновил свой API, представив новое поколение моделей с увеличенным контекстом и объявив о скором прекращении поддержки старых версий. Разработчикам, использующим DeepSeek, предстоит запланировать миграцию.
**Формат координат и ответа:**
Точка: (x, y) или [(x1, y1), (x2, y2)] Коробка: [xmin, ymin, xmax, ymax] Координаты нормализованы до целочисленного диапазона (0, 1000). В режиме thinking mode ответы структурированы как…