腾讯混元宣布推出极致量化压缩版本翻译模型 Hy-MT1.5-1.8B-1.25bit,把支持 33 种语言的翻译大模型压缩至 440MB,无需联网,下载即可直接在手机本地运行,声称翻译质量优于谷歌翻译。

根据介绍,Hy-MT1.5 是腾讯混元团队打造的专业翻译大模型,原生支持 33 种语言、5 种方言/民汉及 1056 个翻译方向。涵盖常见的中英互译,到法语、日语、阿拉伯语、俄语,甚至藏语、蒙古语等少数民族语言。以 1.8B 参数量,实现了比肩商业翻译 API 和 235B 级大模型的翻译效果。

针对不同的手机用户,腾讯推出了 2-bit 与 1.25-bit 两种极致的量化压缩方案。

2-bit 模型采用了业内顶尖的拉伸弹性量化(SEQ),将模型参数量化至{-1.5,-0.5,0.5,1.5},并结合量化感知蒸馏,在将模型体积压缩至 574MB 的同时,实现了几乎无损的翻译质量,效果超越上百GB的大模型。在支持 Arm SME2 技术的移动设备上,2-bit 模型能够实现更快速、更高效的推理。
1.25-bit 模型基于 Sherry(稀疏高效三值量化) 技术。该技术方案已经被NLP顶级学术会议ACL 2026录用。Sherry 压缩方案的核心逻辑在于“细粒度稀疏”策略:每4个模型参数,3个最重要的用 1-bit 储存,1个用0储存,平均每个参数仅需 1.25-bit。

配合腾讯专门为手机 CPU 设计的 STQ内核,该方案实现了对 SIMD 指令集的完美适配。最终,3.3GB 的原始模型被进一步压缩至 440MB,轻松常驻后台,让内存紧张的普通手机也能顺滑进行高质量离线翻译。
除了开源模型权重外,腾讯方面还制作了一个实际可用的腾讯混元翻译Demo版,特别适配了“后台取词模式”。无论是在本地查看邮件还是浏览网页,混元翻译都能随叫随到。无需网络,无需订阅,完全本地处理、不涉及个人信息的采集和上传,一次下载永久使用。
目前所有的模型权重、代码及技术报告均已全面开源。暂时只支持安卓体验 demo, 后续正式版会添加对 IOS 等平台的支持。