Стоит читать если: вы ищете готовые к развертыванию модели для многоязычного перевода, интересуетесь оптимизацией для edge-устройств или работаете с бенчмарками качества перевода. Можно пропустить если: ваша задача не связана с машинным переводом или вам не нужны модели, развернутые на устройствах.
Семейство Hy-MT2: "быстрое мышление" для 33 языков
Tencent Hunyuan представила серию моделей Hy-MT2, ориентированных на многоязычный перевод в реальных условиях. Модели позиционируются как "fast-thinking" (быстро мыслящие), что указывает на их способность к эффективной обработке запросов. В линейку входят три размера:
- Hy-MT2-1.8B
- Hy-MT2-7B
- Hy-MT2-30B-A3B (MoE)
Все модели поддерживают перевод между 33 языками и следуют инструкциям по переводу на нескольких языках.
Производительность и оптимизация для edge-устройств
Модели Hy-MT2 продемонстрировали высокую производительность в различных сценариях: от общего перевода до задач, специфичных для предметных областей и следования инструкциям.
- Модели Hy-MT2-7B и Hy-MT2-30B-A3B (MoE) превзошли открытые модели, такие как DeepSeek-V4-Pro и Kimi K2.6, в режиме "быстрого мышления".
- Легковесная модель Hy-MT2-1.8B опередила коммерческие API от провайдеров, включая Microsoft и Doubao.
Для развертывания на устройствах предусмотрена экстремальная квантизация AngelSlim 1.25-бит. Эта оптимизация уменьшает требования к хранилищу модели 1.8B до 440 МБ и увеличивает скорость вывода в 1.5 раза. Это позволяет использовать модель на устройствах с ограниченными ресурсами без существенной потери качества.
Вместе с моделями выпущен IFMTBench, бенчмарк для оценки возможностей следования инструкциям перевода. Это инструмент для разработчиков, который помогает точно измерить, насколько хорошо модель справляется с конкретными задачами перевода по заданным правилам.
Детали использования и развертывания
Модели можно развернуть с использованием популярных фреймворков. Поддерживаются transformers (версии >=5.6.0), vLLM, SGLang и llama.cpp.
- Рекомендуемые параметры инференса для моделей 1.8B и 7B:
temperature: 0.7,top_p: 0.6,top_k: 20,repetition_penalty: 1.05,max_tokens: 4096. - Для 30B-A3B параметры несколько отличаются:
temperature: 0.7,top_p: 1.0,top_k: -1,repetition_penalty: 1.0,max_tokens: 4096. - Пример промпта для перевода:
Translate the following text into {target_lang}. Note that you should only output the translated result without any additional explanation: {source_text}. Модели поддерживают различные стили промптов, включая терминологию, стиль, персонализацию, работу с разделителями и структурированными данными.
Tencent Hy также сотрудничает с WMT26, участвуя в «Задаче перевода субтитров видео» и «Общей задаче машинного перевода». Участники, использующие модели Hy-MT, получат шанс выиграть специальные призы.
Что это значит
Выпуск семейства Hy-MT2 от Tencent Hunyuan расширяет выбор для инженеров, работающих над задачами многоязычного перевода, особенно там, где важна производительность на устройствах и высокая точность. Возможность точной настройки под инструкции и эффективная работа с квантизацией делают эти модели релевантным выбором для создания локальных или гибридных решений перевода.