腾讯混元开源翻译模型1.5 支持端侧部署性能超商用API

【CNMO 科技消息】12 月 30 日，腾讯官方宣布开源其混元翻译模型 1.5 版本，包含 Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B 两款模型，支持 33 种国际语言互译及 5 种民汉 / 方言翻译，覆盖捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。两个模型已在腾讯混元官网、GitHub 及 HuggingFace 平台上线，供开发者免费下载使用。

其中，HY-MT1.5-1.8B 专为手机等消费级设备优化，经量化后仅需 1GB 内存即可实现端侧离线实时翻译，在参数量极小的情况下，翻译效果已超过多数主流商用翻译 API。实测显示，该模型处理 50 个 tokens 平均耗时仅 0.18 秒，显著快于其他商用模型约 0.4 秒的响应时间。在 FLORES-200、WMT25 及民汉翻译测试集中，其表现达到 Gemini-3.0-Pro 闭源模型 90% 的水平，部分场景下差距微小，远超同类开源与商用方案。

HY-MT1.5-7B 则为此前 WMT25 比赛 30 项冠军模型的升级版，重点提升翻译准确率，有效减少译文夹带注释或语种混杂问题。两款模型可协同部署，实现端云结合，提升整体翻译一致性与稳定性。

实用性方面，新模型支持术语库自定义、上下文长文本理解及带格式文本翻译。用户可导入医学、法律、金融等行业术语表，确保专业词汇准确；模型还能基于前文语境优化后续翻译，适用于会议记录、小说章节等长内容；同时保留原始排版格式，提升网页、文档等结构化内容的翻译可用性。

技术上，1.8B 模型通过 On-Policy Distillation 策略，由 7B 大模型作为教师实时引导训练，避免死记硬背，显著提升小模型泛化能力。目前，该系列模型已在腾讯会议、企业微信、QQ 浏览器等内部产品中落地，并兼容 Arm、高通、Intel、沐曦等主流硬件平台。

宙世代

一起剪

相关标签