腾讯首发并开源Hy3 preview，姚顺雨称其为「混元大模型重建的第一步」

" 主打全面实用性，Agent 能力大幅提升。"

作者：苏打

编辑：tuya

出品：财经涂鸦（ID：caijingtuya）

公司情报专家《财经涂鸦》获悉，4 月 23 日，腾讯混元 Hy3 preview 语言模型发布并开源，成为混元重建后训练的第一个模型，也是混元迄今最智能的模型。

作为一个快慢思考融合的混合专家模型，Hy3 preview 总参数 295B，激活参数 21B，在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升，最大支持 256K 上下文长度。

今年 2 月，腾讯混元重建了预训练和强化学习的基础设施，以及模型追求实用性的三个原则，包括能力体系化、不推崇 " 偏科 "，评测真实性以及性价比。

"Hy3 preview 是混元大模型重建的第一步。" 腾讯首席 AI 科学家姚顺雨表示，" 我们希望通过这次开源和发布，获得来自开源社区和用户的真实反馈，帮助我们提升 Hy3 正式版的实用性。"

" 与此同时，我们也在继续扩大预训练和强化学习的规模，提升模型的智能上限，并通过与腾讯众多产品的深度 Co-Design，持续提升模型在真实场景中的综合表现，并开始探索特色模型能力。"

多个测评结果显示，Hy3 preview 模型能力全面提升。

首先，出色的上下文学习和指令遵循能力。基于腾讯业务场景的灵感，腾讯混元提出了 CL-bench 和 CL-bench-Life 来创新性地评估模型的上下文学习能力，并在 Hy3 preview 显著地提升了模型上下文学习和指令遵循能力。

其次，复杂推理能力突出。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高难度理工科推理任务中表现突出，并在最新的清华大学求真书院数学博资考 ( 26 春 ) 和全国中学生生物学联赛 ( CHSBO 2025 ) 中取得优异成绩，展现了可泛化的强推理能力。

第三，代码与智能体提升最为显著，展现出高性价比。得益于预训练及强化学习框架的重建和强化学习任务规模的提升，腾讯混元以较快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代码智能体基准以及 BrowseComp、WideSearch 等主流搜索智能体基准中取得了有竞争力的结果。

目前，Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ 浏览器、腾讯文档、腾讯乐享等首发上线，微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。另外，Hy3 preview 支持接入流行的开源智能体产品，如 OpenClaw、OpenCode、KiloCode 等，并已上架腾讯云大模型服务平台 TokenHub。

得益于模型和推理框架上的深度协同，以及在推理框架、算子性能、量化算法等全方面优化，Hy3 preview 整体推理效率提升 40%，成本相比上一代模型大幅下降。

在腾讯云大模型服务平台 TokenHub 上，Hy3 preview 输入价格最低 1.2 元 / 百万 tokens，输入命中缓存价格 0.4 元 / 百万 tokens，输出价格最低 4 元 / 百万 tokens。同时，腾讯云联合混元推出定制的 Hy3 preview Token Plan 套餐，个人版定价最低 28 元 / 月，为 Agent 开发和打造 " 龙虾 " 应用的提供更具性价比选择。

值得一提的是，今年 3 月份财报发布之际，腾讯曾透露，HY 3.0 正在内部业务测试中，将于 4 月对外推出，相比 HY2.0 版本效果进步明显，推理和 agent 能力有显著提升。

本文由公众号财经涂鸦（ID：caijingtuya）原创撰写，如需转载请联系涂鸦君。

添加涂鸦君个人微信（ID：tuyaclub）

加入【公司情报社群】

参与资本市场讨论

获取一手情报

宙世代

一起剪

相关标签