Tencent представила Hunyuan-MT-7B и Chimera-7B: прорыв в открытом мультиязычном переводе

Новые открытые модели от Tencent Hunyuan

Команда Hunyuan из Tencent выпустила две открытые системы перевода: Hunyuan-MT-7B, 7-миллиардную модель перевода, и Hunyuan-MT-Chimera-7B, ансамблевую модель с подходом weak-to-strong fusion. Оба решения нацелены на мультиязычный машинный перевод и были представлены вместе с участием Tencent в задаче WMT2025. Hunyuan-MT-7B заняла первое место в 30 из 31 языковой пары.

Архитектура и возможности моделей

Hunyuan-MT-7B — модель на 7 млрд параметров, способная на взаимный перевод между 33 языками, включая китайские меньшинства: тибетский, монгольский, уйгурский и казахский. Модель оптимизирована для задач с большим и малым объемом данных и показывает лучшие результаты среди моделей сопоставимого размера.

Hunyuan-MT-Chimera-7B представляет собой интегрированную weak-to-strong fusion систему. На этапе инференса она комбинирует несколько кандидатных переводов и применяет награды и методы агрегации для получения усовершенствованного финального перевода. По заявлению авторов, Chimera-7B — первый открытый модель такого типа и она улучшает качество по сравнению с одиночными системами.

Методика обучения

Tencent описывает пятиступенчатую схему обучения:

Оценки и сравнение

Автоматические бенчмарки показывают впечатляющие результаты:

По сравнению с Google Translate модель превосходит его на 15–65% в разных категориях оценивания. При этом Hunyuan-MT-7B опережает специализированные модели вроде Tower-Plus-9B и Seed-X-PPO-7B, несмотря на меньший размер. Chimera-7B добавляет порядка 2.3% к FLORES-200, особенно в направлениях Chinese⇔Other и non-English⇔non-Chinese.

Человеческая оценка по мультидоменному сету (социальная, медицинская, юридическая, интернет) показала: Hunyuan-MT-7B средний балл 3.189, Gemini-2.5-Pro 3.223, DeepSeek-V3 3.219, Google Translate 2.344. Это демонстрирует, что 7 млрд модель может приближаться к качеству гораздо более крупных закрытых систем.

Примеры из практики

В отчете приведены реальные кейсы:

Значение для сообщества

Открытый релиз Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B предоставляет сообществу исследователей и инженеров доступ к мощным инструментам для мультиязычного перевода. Комбинация продуманной предобучающей схемы, тщательной подготовки данных и методов RL показывает практический путь к улучшению качества как в частых, так и в редких языковых парах. Для детальных технических сведений и материалов по воспроизводимости смотрите репозиторий и технический отчет команды:

https://github.com/Tencent-Hunyuan/Hunyuan-MT/blob/main/Hunyuan_MT_Technical_Report.pdf https://github.com/Tencent-Hunyuan/Hunyuan-MT