【CNMO 科技消息】12 月 30 日,腾讯官方宣布开源其混元翻译模型 1.5 版本,包含 Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B 两款模型,支持 33 种国际语言互译及 5 种民汉 / 方言翻译,覆盖捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。两个模型已在腾讯混元官网、GitHub 及 HuggingFace 平台上线,供开发者免费下载使用。

其中,HY-MT1.5-1.8B 专为手机等消费级设备优化,经量化后仅需 1GB 内存即可实现端侧离线实时翻译,在参数量极小的情况下,翻译效果已超过多数主流商用翻译 API。实测显示,该模型处理 50 个 tokens 平均耗时仅 0.18 秒,显著快于其他商用模型约 0.4 秒的响应时间。在 FLORES-200、WMT25 及民汉翻译测试集中,其表现达到 Gemini-3.0-Pro 闭源模型 90% 的水平,部分场景下差距微小,远超同类开源与商用方案。

HY-MT1.5-7B 则为此前 WMT25 比赛 30 项冠军模型的升级版,重点提升翻译准确率,有效减少译文夹带注释或语种混杂问题。两款模型可协同部署,实现端云结合,提升整体翻译一致性与稳定性。

实用性方面,新模型支持术语库自定义、上下文长文本理解及带格式文本翻译。用户可导入医学、法律、金融等行业术语表,确保专业词汇准确;模型还能基于前文语境优化后续翻译,适用于会议记录、小说章节等长内容;同时保留原始排版格式,提升网页、文档等结构化内容的翻译可用性。

技术上,1.8B 模型通过 On-Policy Distillation 策略,由 7B 大模型作为教师实时引导训练,避免死记硬背,显著提升小模型泛化能力。目前,该系列模型已在腾讯会议、企业微信、QQ 浏览器等内部产品中落地,并兼容 Arm、高通、Intel、沐曦等主流硬件平台。


登录后才可以发布评论哦
打开小程序可以发布评论哦