腾讯开源混元翻译模型 Hunyuan-MT
腾讯混元团队正式开源了面向翻译场景的 Hunyuan-MT 系列模型。该系列目前包含两个版本:
- Hunyuan-MT-7B:单模型版本,支持 33 种语言之间的双向翻译,覆盖中、英、日、法等主流语种以及藏、维、蒙、哈、朝 5 种中国少数民族语言;在 WMT25 竞赛的 31 个语言方向上取得领先成绩 。
- Hunyuan-MT-Chimera-7B:集成模型,通过融合多路翻译结果进一步提升译文质量 。
Hunyuan-MT-7B 在同等规模下达到了业界领先的翻译性能,而 Hunyuan-MT-Chimera-7B 通过集成多路翻译输出进一步提升了质量。
核心特性与优势
- WMT25 参赛 31 语种之中 30 语种获得第一名的成绩。
- Hunyuan-MT-7B 同尺寸业界效果最优
- Hunyuan-MT-Chimera-7B 是业界首个开源翻译集成模型,可以将翻译效果再拉高一个档次
- 提出了一个完整的翻译模型训练范式,从 Pretrain->CPT->SFT-> 翻译强化 -> 集成强化,翻译效果达到同尺寸 SOTA。
效果
开源地址:https://github.com/Tencent-Hunyuan/Hunyuan-MT
