qwen3: гибридные рассуждения и сотни миллионов загрузок

Hero illustration: qwen3: гибридные рассуждения и сотни миллионов загрузок.

О чём эта новость

Qwen3 использует гибридные режимы рассуждений, динамически переключаясь между глубоким «мышлением» для сложных задач и быстрым «немышлением» для простых ответов.подробнее →
Серия включает восемь моделей, как плотных, так и MoE, доступных на Hugging Face и ModelScope под лицензией Apache 2.0.подробнее →
Модель поддерживает 119 языков и диалектов, значительно улучшает агентские возможности с помощью MCP и превосходит предыдущие версии в рассуждениях.подробнее →
Семейство Qwen превысило 300 миллионов загрузок и стало основой для более чем 100 000 производных моделей, что подтверждает его влияние на открытый ИИ.подробнее →

29 апреля 2025 года Alibaba представила Qwen3, новейшее поколение своих открытых больших языковых моделей (БЯМ), призванное установить новый стандарт инноваций в области искусственного интеллекта. Эта серия моделей внедряет передовую архитектуру гибридных рассуждений, предлагая гибкость и высокую производительность для широкого спектра приложений — от мобильных устройств до автономных транспортных средств. Запуск Qwen3 укрепляет позицию Alibaba как лидера в области открытого ИИ, предоставляя разработчикам мощные и доступные инструменты.

Представление Qwen3 и гибридные режимы рассуждений

Qwen3, запущенный Alibaba 29 апреля 2025 года, представляет собой последнее поколение семейства открытых больших языковых моделей компании, которое позиционируется как новый эталон в инновациях ИИ. Основной прорыв Qwen3 заключается во внедрении инновационной архитектуры гибридных рассуждений, которая сочетает традиционные возможности БЯМ с динамическим и адаптивным подходом к решению задач.

Главная инновация Qwen3 — это гибридные режимы рассуждений, позволяющие моделям бесшовно переключаться между двумя основными состояниями: режимом «мышления» (Thinking Mode) и режимом «немышления» (Non-thinking Mode). Режим «мышления» предназначен для сложных, многоэтапных задач, требующих глубокого анализа, таких как математика, кодирование и логические выводы. В этом режиме модель уделяет время поэтапному рассуждению, прежде чем выдать окончательный ответ. Режим «немышления», напротив, обеспечивает быстрые, практически мгновенные ответы, что делает его идеальным для общих задач, где скорость важнее глубокого осмысления.

Эта адаптивность позволяет модели эффективно подстраиваться под конкретные требования задачи. Для разработчиков, использующих Qwen3 через API, предусмотрена гранулированный контроль над продолжительностью «мышления» модели, позволяющий задавать бюджет до 38 000 токенов. Это дает возможность оптимизировать баланс между производительностью и вычислительной эффективностью, настраивая модель на выполнение более сложных рассуждений, когда это необходимо, и на быстрые ответы для простых запросов. Интеграция этих режимов значительно улучшает способность модели стабильно и эффективно управлять бюджетом на мыслительные операции, что приводит к масштабируемому улучшению производительности, напрямую зависящему от выделенного вычислительного бюджета.

Процесс разработки гибридной модели рассуждений включал четырехэтапный процесс обучения. Он охватывает холодный старт с длинной цепочкой рассуждений (CoT), обучение с подкреплением на основе рассуждений (RL), слияние режимов мышления и общее обучение с подкреплением (RL). Однако более подробная информация о каждом этапе этого четырехэтапного процесса обучения в источниках отсутствует.

Семейство моделей Qwen3: варианты и доступность

Серия Qwen3 включает разнообразное семейство моделей, предлагающих гибкость для различных сценариев использования. В него входят шесть плотных моделей с параметрами от 0.6B до 32B, а также две модели Mixture-of-Experts (MoE): Qwen3-30B-A3B (30 миллиардов общих параметров с 3 миллиардами активных) и Qwen3-235B-A22B (235 миллиардов общих параметров с 22 миллиардами активных). Модели MoE разработаны для повышения эффективности и производительности, при этом модель Qwen3-235B-A22B MoE значительно снижает затраты на развертывание по сравнению с другими передовыми моделями.

Все модели Qwen3 доступны для свободного скачивания и использования разработчиками по всему миру. Их можно найти на популярных платформах, таких как Hugging Face, GitHub и ModelScope, а также опробовать в чате на chat.qwen.ai. Доступ через API также будет предоставлен через платформу разработки моделей ИИ Alibaba Model Studio. Модели распространяются под лицензией Apache 2.0, что обеспечивает широкие возможности для их интеграции и модификации.

В течение последних трех месяцев после первоначального выпуска, Alibaba продолжила совершенствовать семейство Qwen3, представив обновленные версии под названием Qwen3-2507. Эти обновления доступны для трех размеров моделей: 235B-A22B, 30B-A3B и 4B, и включают как версии Instruct-2507 (для режима «немышления»), так и Thinking-2507 (для режима «мышления»). Эти версии демонстрируют значительные улучшения в общих возможностях, таких как следование инструкциям, логическое рассуждение, понимание текста, математика, кодирование и использование инструментов, а также улучшенное выравнивание с предпочтениями пользователя.

Расширенные возможности и эталонные показатели Qwen3

Qwen3 предлагает значительные улучшения в ряде ключевых областей, опираясь на массивный набор данных из 36 триллионов токенов — что вдвое больше, чем у его предшественника Qwen2.5. В области многоязычности Qwen3 демонстрирует превосходство в поддержке 119 языков и диалектов, обеспечивая ведущую производительность в задачах перевода и следовании многоязычным инструкциям. Это значительно расширяет глобальное применение моделей и их доступность для пользователей по всему миру.

В части агентских возможностей Qwen3 достигает прорывных улучшений, нативно поддерживая Model Context Protocol (MCP) и надежный вызов функций. Это позволяет моделям Qwen3 показывать лидирующие результаты среди открытых моделей в сложных задачах, основанных на агентах, где требуется взаимодействие с внешними инструментами и средами.

Превосходство в рассуждениях является одной из визитных карточек Qwen3. Модель превосходит предыдущие версии Qwen (QwQ в режиме «мышления» и Qwen2.5 в режиме «немышления») в бенчмарках по математике, кодированию и логическому рассуждению. Обновленные версии Qwen3-2507 дополнительно усиливают общие возможности, включая логическое рассуждение, математику, науку, кодирование и академические бенчмарки, обычно требующие экспертных знаний, достигая самых высоких результатов среди открытых моделей «мышления».

Помимо этого, Qwen3 значительно улучшает взаимодействие с пользователем и качество генерации текста благодаря усиленному выравниванию с человеческими предпочтениями. Это проявляется в более естественном творческом письме, ролевых играх и многоходовых диалогах, что приводит к более увлекательным и естественным беседам. Модель также обладает расширенными возможностями понимания длинного контекста до 256K токенов, с потенциалом расширения до 1 миллиона токенов, что обеспечивает глубокое понимание сложных запросов и документов.

Ведущая производительность Qwen3 подтверждается топовыми результатами в отраслевых бенчмарках, таких как AIME25 (математическое рассуждение), LiveCodeBench (компетентность в кодировании), BFCL (возможности использования инструментов и вызова функций) и Arena-Hard (бенчмарк для БЯМ, настроенных на следование инструкциям). Эти достижения обусловлены улучшенной архитектурой модели, увеличенным объемом обучающих данных и более эффективными методами обучения. Однако в источниках нет сравнительной оценки снижения затрат на развертывание для модели MoE Qwen3-235B-A22B по сравнению с конкурирующими моделями.

Внедрение и использование Qwen3 для разработчиков

Для разработчиков, стремящихся интегрировать Qwen3 в свои проекты, доступны различные варианты развертывания и использования. Для крупномасштабного развертывания и инференса Alibaba рекомендует использовать такие фреймворки, как SGLang и vLLM, которые оптимизированы для эффективной работы с большими языковыми моделями. Также упоминаются TGI.

Локальное использование Qwen3 возможно как на CPU, так и на GPU, что делает его доступным для широкого круга разработчиков с различными вычислительными ресурсами. Для локального запуска моделей предлагаются такие инструменты, как Ollama, LMStudio, MLX, llama.cpp и KTransformers. Эти опции обеспечивают легкую интеграцию Qwen3 в рабочие процессы в исследовательских, разработочных или производственных средах.

Alibaba предоставляет обширные ресурсы для изучения и использования Qwen3. На официальном GitHub-репозитории QwenLM/Qwen3 доступны документация, примеры использования и руководства, охватывающие быструю установку, инференс с использованием Transformers (включая пакетный и потоковый инференс), локальный запуск, развертывание, квантование (GPTQ, AWQ, GGUF) и пост-обучение (SFT, RLHF). Дополнительно, коллекция Qwen3 на Hugging Face содержит все необходимые контрольные точки и информацию о моделях.

Qwen3 также обладает расширенными возможностями по работе с длинными контекстами. Модели способны понимать контекст длиной до 256K токенов, а некоторые версии, такие как Qwen3-2507, могут быть расширены до 1 миллиона токенов, что позволяет обрабатывать очень большие объемы информации для сложных задач. Это открывает новые горизонты для создания приложений, требующих глубокого анализа и понимания объемных текстов.

Влияние и перспективы открытой модели Qwen

С момента своего дебюта семейство моделей Qwen оказало значительное влияние на мировое сообщество открытого ИИ. Общее количество загрузок моделей Qwen по всему миру превысило 300 миллионов, что свидетельствует о широком распространении и популярности. Это также привело к созданию более 100 000 производных моделей на основе Qwen на платформе Hugging Face, что делает Qwen одной из самых широко используемых серий открытых моделей ИИ в мире.

Qwen3 является ключевым элементом в стратегии Alibaba по развитию открытого ИИ, предлагая мощные и доступные инструменты разработчикам. Модель уже используется в собственных продуктах Alibaba, например, она лежит в основе флагманского приложения AI-супер-ассистента Alibaba — Quark. Однако, конкретные примеры использования или истории успеха Qwen3 за пределами питания приложения Quark в источниках не раскрываются.

Широкое принятие и постоянное развитие семейства Qwen, в частности с появлением Qwen3, подчеркивает приверженность Alibaba к продвижению открытых инноваций в области искусственного интеллекта. Предоставляя сообществу передовые инструменты, Alibaba стимулирует дальнейшие исследования и разработки, ускоряя создание нового поколения интеллектуальных приложений.

Что это значит

Qwen3, благодаря своей инновационной архитектуре гибридных рассуждений и широкому спектру доступных моделей, укрепляет позицию Alibaba как ключевого игрока в области открытого ИИ. Предоставляя разработчикам гибкие, высокопроизводительные и доступные инструменты, Qwen3 не только повышает эффективность решения сложных задач, но и стимулирует беспрецедентные инновации в глобальном сообществе. Эта модель служит мощной основой для создания следующего поколения интеллектуальных приложений, от мобильных устройств до продвинутых агентских систем, определяя будущее развития искусственного интеллекта.

qwen3: гибридные рассуждения и сотни миллионов загрузок daily