当智谱创始人唐杰在 X 平台直接回呛马斯克 " 用不了那么久 " 时,这场关于中国 AI 追赶时间线的争论,实则揭开了全球 AI 行业开源模型与闭源模型未来发展趋势的深层博弈——开源正从追赶者变成规则重塑者,而闭源则在向 " 真实实用价值 " 与 " 生态护城河 " 收缩。
一、新基准:性能差距缩小,性价比成为胜负手
智谱 GLM-5.2 在编程基准 FrontierSWE 上得分 74.4,仅落后 Anthropic 闭源旗舰 Opus 4.8 约 1 个百分点,超过 GPT-5.5。
在 Artificial Analysis 综合榜单上,GLM-5.2 获得 51 分,比肩 Claude Opus 4.8,登顶全球开源模型第一。
同等任务下,GLM-5.2 调用成本仅 0.06 美元,而 Opus 4.8 需 0.49 美元,成本低 6 倍以上。
行业已形成共识:当开源模型能以 1/10 甚至更低价格完成 95% 的任务时,闭源模型那 5% 的领先溢价变得极其脆弱。
二、新格局:地缘管制加速开源替代
2026 年 6 月 12 日,美国政府援引国家安全指令,要求 Anthropic 立即切断所有非美籍用户对 Fable 5 和 Mythos 5 的访问权限。
闭源模型遭遇 " 随时断供 " 的风险,而开源权重完全开放、支持本地私有化部署,完美规避政策风险。
在 Anthropic 两款旗舰模型下架后,国产开源模型在 OpenRouter 等平台上承接了外流需求,市场份额快速扩大。
智谱明确表态:" 前沿智能不应只属于少数人,也不应被少数规则随时收回 "。
三、新战场:从 " 跑分竞赛 " 转向 " 实用价值 "
马斯克在争论中强调:Anthropic 的核心优势在于真实实用价值的智能,这种能力不会体现在跑分榜单上,却能直接转化为商业营收。
独立研究员 Teortaxes 分析认为,GLM-5.2 在中等复杂度的长期任务上已比肩顶尖闭源,但在极限超长复杂工程任务上仍有明显代差(SWE-Marathon 得分 13 vs Opus 4.8 的 26)。
开发者生态正形成 " 分层调用 " 模式:基础任务用本地开源模型,复杂架构设计才求助闭源 API,此举可砍掉 80% 的 Token 成本。
AI 竞争已从 " 谁最强 " 转向 " 谁在真实场景中更稳定、更便宜、更可控 "。
四、新变量:开源生态催生 " 后训练 " 浪潮
开源基座模型衍生出 " 后训练 " 新生态,硅谷已涌现大量 Neo Lab,基于开源模型做垂直领域微调。
例如,国内团队 Mindverse 基于 GLM-5.1 后训练的 Macaron-V1-Preview,在生成式 UI 等场景中甚至超越了原始模型。
开源模型正从 " 技术产品 " 转变为 " 基础设施 ",降低全球开发者的入门门槛,加速创新扩散。
中国开源模型已实现群体性突破:Qwen、DeepSeek、GLM 三条线轮番迭代,闭源公司的传统护城河正在被逐一拆解。
五、未来趋势研判
维度
开源模型趋势
闭源模型趋势
性能定位追平 90%~95% 的通用场景,主打 " 够用 + 便宜 " 守住极限复杂任务与真实可用性的 5%~10% 领先
商业模式生态增值服务、企业定制、后训练衍生 API 订阅、高端企业定制、系统集成锁定
竞争优势可自主部署、可控、低成本、无断供风险商业化成熟、技术壁垒、品牌与营收验证
发展路径群体协作加速迭代,技术共享赋能全行业依靠资本、数据与人才优势构建护城河
未来格局成为 AI 基础设施,与闭源长期共存、相互促进向高价值、高安全、高稳定性场景集中
开源与闭源不会相互取代,而是走向 " 性能上限、成本效率与扩散速度 " 的三维分层竞争。
闭源模型仍将在金融、医疗、法律等高风险领域占据优势,因为企业需要稳定的供应商与可追责的商业保障。
开源模型将在定制化、深度集成、学术研究、初创创新等领域持续扩张,尤其适合需要 AI 主权的企业与开发者。
两者相互促进:闭源为开源提供追赶目标与标杆;开源为闭源提供创新土壤与人才储备。
唐杰的 " 不用那么久 " 与马斯克的谨慎预判,本质上代表了两种路线对技术演进速度的不同信念——但行业共识是,中国开源模型已从 " 能不能做 " 进入 " 谁做得更稳、更久、更便宜 " 的新阶段。
本文由 AI 生成


登录后才可以发布评论哦
打开小程序可以发布评论哦