
" 主打全面实用性,Agent 能力大幅提升。"
作者:苏打
编辑:tuya
出品:财经涂鸦(ID:caijingtuya)

公司情报专家《财经涂鸦》获悉,4 月 23 日,腾讯混元 Hy3 preview 语言模型发布并开源,成为混元重建后训练的第一个模型,也是混元迄今最智能的模型。
作为一个快慢思考融合的混合专家模型,Hy3 preview 总参数 295B,激活参数 21B,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升,最大支持 256K 上下文长度。
今年 2 月,腾讯混元重建了预训练和强化学习的基础设施,以及模型追求实用性的三个原则,包括能力体系化、不推崇 " 偏科 ",评测真实性以及性价比。
"Hy3 preview 是混元大模型重建的第一步。" 腾讯首席 AI 科学家姚顺雨表示," 我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升 Hy3 正式版的实用性。"
" 与此同时,我们也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度 Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。"
多个测评结果显示,Hy3 preview 模型能力全面提升。
首先,出色的上下文学习和指令遵循能力。基于腾讯业务场景的灵感,腾讯混元提出了 CL-bench 和 CL-bench-Life 来创新性地评估模型的上下文学习能力,并在 Hy3 preview 显著地提升了模型上下文学习和指令遵循能力。
其次,复杂推理能力突出。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高难度理工科推理任务中表现突出,并在最新的清华大学求真书院数学博资考 ( 26 春 ) 和 全国中学生生物学联赛 ( CHSBO 2025 ) 中取得优异成绩,展现了可泛化的强推理能力。
第三,代码与智能体提升最为显著,展现出高性价比。得益于预训练及强化学习框架的重建和强化学习任务规模的提升,腾讯混元以较快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代码智能体基准以及 BrowseComp、WideSearch 等主流搜索智能体基准中取得了有竞争力的结果。
目前,Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ 浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。另外,Hy3 preview 支持接入流行的开源智能体产品,如 OpenClaw、OpenCode、KiloCode 等,并已上架腾讯云大模型服务平台 TokenHub。
得益于模型和推理框架上的深度协同,以及在推理框架、算子性能、量化算法等全方面优化,Hy3 preview 整体推理效率提升 40%,成本相比上一代模型大幅下降。
在腾讯云大模型服务平台 TokenHub 上,Hy3 preview 输入价格最低 1.2 元 / 百万 tokens,输入命中缓存价格 0.4 元 / 百万 tokens,输出价格最低 4 元 / 百万 tokens。同时,腾讯云联合混元推出定制的 Hy3 preview Token Plan 套餐,个人版定价最低 28 元 / 月,为 Agent 开发和打造 " 龙虾 " 应用的提供更具性价比选择。
值得一提的是,今年 3 月份财报发布之际,腾讯曾透露,HY 3.0 正在内部业务测试中,将于 4 月对外推出,相比 HY2.0 版本效果进步明显,推理和 agent 能力有显著提升。
本文由公众号财经涂鸦(ID:caijingtuya)原创撰写,如需转载请联系涂鸦君。
添加涂鸦君个人微信(ID:tuyaclub)
加入【公司情报社群】
参与资本市场讨论
获取一手情报



登录后才可以发布评论哦
打开小程序可以发布评论哦