Новости AI-стека
Daily · свежие материалы
Ray3.2 от Luma: покадровое управление видео и первый полноценный API
До 16 кейфреймов в одном клипе и 16-bit EXR на выходе — впервые всё это доступно через API; 5 секунд в 1080p стоят $1.20.
Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле
Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.
Sculpt4D от Tencent ARC генерирует 4D-объекты из видео — на 56% дешевле полного внимания
Модель надстроена над Hunyuan3D 2.1 и уже открыта на Hugging Face — но время инференса и лицензия не раскрыты.
Luma Ray3.14 заменил захват движений на живом выступлении в Париже
Модель в 4 раза быстрее и в 3 раза дешевле предшественника — теперь в руках независимых авторов.
Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди
100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.
Luma открывает Physical AI Lab: ставка на открытую науку против монополии в робототехнике
Luma объявила об Open Physical AI Lab — исследовательской инициативе с открытым доступом, нацеленной на проблему обобщения в физическом ИИ. Компания считает её главным барьером между нынешними роботами и системами…
Quick BI против галлюцинирующих агентов: почему данные важнее модели
На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…
Qwen-VLA: От осмысления к активному вмешательству в реальный мир
Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.
qwen-cloud: облако, где агенты говорят на одном языке
Alibaba Cloud представила Qwen Cloud 26 мая в Сингапуре, создав AI-нативную платформу для работы с агентами и мультимодальными моделями.
Alibaba Cloud: комплексная экосистема для агентного ИИ и глобального масштаба
На первой международной конференции Qwen в Сингапуре Alibaba Cloud представила новые модели, инфраструктуру и инструменты для построения и управления ИИ-агентами.
qwen3: гибридные рассуждения и сотни миллионов загрузок
Alibaba представила Qwen3 — новое поколение своих открытых больших языковых моделей, вводя гибридные режимы рассуждений и расширяя возможности агентов и многоязычной поддержки.
qwen3.5-livetranslate-Flash: Переводит речь, видит контекст, клонирует голос
Alibaba выпустила qwen3.5-livetranslate-Flash, новейшую модель синхронного перевода, которая не просто слушает и переводит речь, но и понимает визуальный контекст. Эта многомодальная система, построенная на архитектуре…
Qwen3.7-Max: Модель для агентов и перевод, который видит
Alibaba представила две новые модели: Qwen3.7-Max, ориентированную на автономных агентов, и Qwen3.5-LiveTranslate-Flash, способную к синхронному переводу с учетом визуального контекста. Это развитие AI-возможностей…
StereoCrafter2: Tencent ARC Lab обновила модель для иммерсивного видео
Tencent ARC Lab выпустила обновление своей модели StereoCrafter, получившее название StereoCrafter2. Новая версия нацелена на решение ключевой проблемы в производстве иммерсивного видео: достижение высокой точности и…
Hy-MT2: многоязычный перевод для сложных сценариев — с оптимизацией для устройств
Tencent Hunyuan выпустила семейство многоязычных моделей перевода Hy-MT2, разработанных для сложных реальных сценариев. Модели доступны в размерах 1.8B, 7B и 30B-A3B (MoE), поддерживают 33 языка и демонстрируют…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
uni-1-1-api: Luma AI запускает управляемый интеллект для продакшена
Luma AI представила uni-1-1-api, REST-интерфейс к своей модели унифицированного интеллекта, который обещает изменить подходы к генерации и редактированию изображений, выводя эти процессы на новый уровень управляемости и…
Pixal3D-D от Tencent: 3D-модель представлена без документации
Tencent ARC Lab представила Pixal3D-D — новую модель для 3D-генерации, которая появилась на Hugging Face. Однако, несмотря на релиз, публичной документации или детального описания, как это часто бывает, пока нет.
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
**Формат координат и ответа:**
Точка: (x, y) или [(x1, y1), (x2, y2)] Коробка: [xmin, ymin, xmax, ymax] Координаты нормализованы до целочисленного диапазона (0, 1000). В режиме thinking mode ответы структурированы как…
Qwen3.6-27B: Мультимодальный агент с «памятью» мышления и контекстом до миллиона токенов
Alibaba представила новую модель Qwen3.6-27B, позиционируя её как решение для инженерных задач, требующих глубокого понимания кода и сохранения контекста рассуждений. Эта версия, доступная на Hugging Face, включает…
Luma AI: гибридное кинопроизводство с ИИ приходит в Голливуд
Luma AI, в партнерстве с Wonder Project и при поддержке AWS, запускает Innovative Dreams — новую производственную компанию, которая интегрирует генеративный ИИ в традиционное кинопроизводство. Цель — преодолеть…
Luma Agents: рекламный ролик Mazda сдан за две недели вместо месяцев — что это меняет?
Luma Agents показали себя в работе над первым рекламным роликом Mazda, полностью созданным с помощью искусственного интеллекта. Кейс южноафриканского агентства Boundless демонстрирует, как новые рабочие процессы могут…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Ray3.14: 1080p, быстрее и дешевле — но без референсов персонажей
Luma AI представила новую модель для генерации видео, Ray3.14, которая обещает существенные улучшения для работы с Dream Machine. Теперь генерация возможна в нативном 1080p, что само по себе делает модель более…