Hy-MT2: многоязычный перевод для сложных сценариев — с оптимизацией для устройств

Hero illustration: Hy-MT2: многоязычный перевод для сложных сценариев — с оптимизацией для устройств.

Стоит читать если: вы ищете готовые к развертыванию модели для многоязычного перевода, интересуетесь оптимизацией для edge-устройств или работаете с бенчмарками качества перевода. Можно пропустить если: ваша задача не связана с машинным переводом или вам не нужны модели, развернутые на устройствах.

Семейство Hy-MT2: "быстрое мышление" для 33 языков

Tencent Hunyuan представила серию моделей Hy-MT2, ориентированных на многоязычный перевод в реальных условиях. Модели позиционируются как "fast-thinking" (быстро мыслящие), что указывает на их способность к эффективной обработке запросов. В линейку входят три размера:

Hy-MT2-1.8B
Hy-MT2-7B
Hy-MT2-30B-A3B (MoE)

Все модели поддерживают перевод между 33 языками и следуют инструкциям по переводу на нескольких языках.

Производительность и оптимизация для edge-устройств

Модели Hy-MT2 продемонстрировали высокую производительность в различных сценариях: от общего перевода до задач, специфичных для предметных областей и следования инструкциям.

Модели Hy-MT2-7B и Hy-MT2-30B-A3B (MoE) превзошли открытые модели, такие как DeepSeek-V4-Pro и Kimi K2.6, в режиме "быстрого мышления".
Легковесная модель Hy-MT2-1.8B опередила коммерческие API от провайдеров, включая Microsoft и Doubao.

Для развертывания на устройствах предусмотрена экстремальная квантизация AngelSlim 1.25-бит. Эта оптимизация уменьшает требования к хранилищу модели 1.8B до 440 МБ и увеличивает скорость вывода в 1.5 раза. Это позволяет использовать модель на устройствах с ограниченными ресурсами без существенной потери качества.

Вместе с моделями выпущен IFMTBench, бенчмарк для оценки возможностей следования инструкциям перевода. Это инструмент для разработчиков, который помогает точно измерить, насколько хорошо модель справляется с конкретными задачами перевода по заданным правилам.

Детали использования и развертывания

Модели можно развернуть с использованием популярных фреймворков. Поддерживаются transformers (версии >=5.6.0), vLLM, SGLang и llama.cpp.

Рекомендуемые параметры инференса для моделей 1.8B и 7B: temperature: 0.7, top_p: 0.6, top_k: 20, repetition_penalty: 1.05, max_tokens: 4096.
Для 30B-A3B параметры несколько отличаются: temperature: 0.7, top_p: 1.0, top_k: -1, repetition_penalty: 1.0, max_tokens: 4096.
Пример промпта для перевода: Translate the following text into {target_lang}. Note that you should only output the translated result without any additional explanation: {source_text}. Модели поддерживают различные стили промптов, включая терминологию, стиль, персонализацию, работу с разделителями и структурированными данными.

Tencent Hy также сотрудничает с WMT26, участвуя в «Задаче перевода субтитров видео» и «Общей задаче машинного перевода». Участники, использующие модели Hy-MT, получат шанс выиграть специальные призы.

Что это значит

Выпуск семейства Hy-MT2 от Tencent Hunyuan расширяет выбор для инженеров, работающих над задачами многоязычного перевода, особенно там, где важна производительность на устройствах и высокая точность. Возможность точной настройки под инструкции и эффективная работа с квантизацией делают эти модели релевантным выбором для создания локальных или гибридных решений перевода.

Hy-MT2: многоязычный перевод для сложных сценариев — с оптимизацией для устройств daily

Семейство Hy-MT2: "быстрое мышление" для 33 языков

Производительность и оптимизация для edge-устройств

Детали использования и развертывания

Что это значит

Ссылки

Источники

Оценить материал