Стоит читать если: вы работаете с агентными архитектурами, нуждаетесь в моделях для написания/отладки кода, или вам требуются системы синхронного многомодального перевода. Можно пропустить если: вам интересны только базовые LLM или текстовый перевод.
Qwen3.7-Max: основа для автономных агентов
Новая модель Qwen3.7-Max создана специально для «эры агентов». Модель позиционируется как универсальная основа для агентных систем, способная решать задачи, которые требуют выполнения сотен и тысяч шагов автономно. Функциональность Qwen3.7-Max охватывает несколько ключевых областей:
- Написание и отладка кода: модель может создавать и исправлять программный код.
- Автоматизация офисных рабочих процессов: выполнение рутинных задач без участия человека.
- Автономное выполнение: способность действовать самостоятельно в сложных сценариях, требующих множества последовательных действий.
Это шаг Alibaba в сторону инструментов, которые не просто генерируют текст, а берут на себя управление сложными цепочками задач, что важно для инженеров, разрабатывающих более самодостаточные AI-системы.
Qwen3.5-LiveTranslate-Flash: перевод, который видит
Qwen3.5-LiveTranslate-Flash — новая модель в семействе Qwen для синхронного перевода, построенная на базе Qwen3.5-Omni. Она предлагает многомодальный перевод в реальном времени, используя не только речевой, но и визуальный контекст для повышения точности. Ключевая особенность модели — понимание визуального контекста. Это позволяет Qwen3.5-LiveTranslate-Flash анализировать не только слова, но и то, что происходит на экране или в поле зрения, чтобы предоставить более осмысленный и правильный перевод. По сравнению с предшественником (Qwen3-LiveTranslate), новая модель призвана улучшить качество перевода за счет этой дополнительной информации.
Fun-ASR1.5: сквозное распознавание речи для 30 языков
Alibaba представила Fun-ASR1.5, крупное обновление своей модели сквозного распознавания речи. Эта версия поддерживает 30 языков, включая китайский, английский, японский, тайский, французский и арабский, обеспечивая высокую точность распознавания в различных регионах мира. Модель Fun-ASR1.5 отличается возможностью бесшовного переключения кодов (code-switching). Используя единую структуру обучения, модель автоматически определяет и переключается между языками в смешанных диалогах без необходимости ручной настройки. Это делает её эффективным инструментом для международной совместной работы, создания многоязычного контента и проведения международных конференций. Дополнительно, для китайского языка Fun-ASR1.5 генерирует «готовый к использованию» текст, который включает интеллектуальную пунктуацию и автоматическое форматирование дат, валют и чисел. Архитектура Fun-ASR1.5 основана на Mixture-of-Experts (MoE), что позволяет балансировать масштаб модели с высокой вычислительной эффективностью за счет активации параметров «по требованию». В сочетании с многоступенчатой стратегией предварительного обучения это повышает точность модели. Доступность Fun-ASR1.5: модель доступна через API-сервисы на платформе Alibaba Cloud Model Studio, а также для тестирования на ModelScope.
Что это значит
Alibaba продолжает активно развивать свои AI-модели в сторону большей автономности и мультимодальности. Для инженеров это означает появление более интеллектуальных и самодостаточных инструментов: от моделей, способных брать на себя сложные агентные задачи, до систем перевода, которые понимают контекст не только на слух, но и визуально. Способность этих моделей к адаптации, например, через автоматическое переключение языков, упрощает разработку глобальных приложений.