在算力被普遍视为 AI(人工智能)竞赛 " 硬通货 " 的今天,月之暗面却给出了一个截然不同的竞争叙事。
北京时间 1 月 21 日晚,在瑞士达沃斯举行的世界经济论坛 2026 年年会上,月之暗面 Kimi 总裁张予彤分享了一个极具冲击力的数据:Kimi 仅使用美国顶尖实验室约 1% 的资源,就开发出开源模型 Kimi K2、Kimi K2 Thinking。

图片来源:企业供图
去年 7 月,月之暗面宣布正式发布 Kimi K2 模型,并同步开源;四个月后,Kimi K2 Thinking 正式发布,被定义为 "Kimi 迄今能力最强的开源思考模型 "。官方公布的实测显示,该模型在 " 人类最后的考试 "、自主网络浏览能力、复杂信息收集推理等多项前沿基准测试中,达到了 SOTA(当前最优)水平。
在全球 AI 赛道中,这一系列动作为世界提供了一种来自中国、以效率为核心的发展范本。在 Kimi 持续突破技术边界的同时,国内 AI 独角兽们猛踩油门,大厂的重资押注也使战况不断升级。在效率与场景化的驱动下,智能技术正加速迈向平权与普适的新阶段。
1% 资源背后的效率革命
去年 K2 Thinking 上线时,外界对其性能表现高度关注,而同步成为焦点的还有其背后的成本效率。去年 11 月,月之暗面创始人 Kimi 杨植麟曾在一场线上问答中透露,外界广为流传的 K2 模型训练成本 "460 万美元 " 并非官方数字,他强调真正的训练成本很难准确量化。
这场问答中,联合创始人吴育昕还透露,K2 Thinking 是在配备了 InfiniBand 的 H800 GPU 集群上完成训练的,尽管算力规模不占优势,但团队 " 把每张显卡的性能都压榨到了极致 "。
" 从创业第一天起我们就清醒地意识到,中国初创公司没有随意堆砌算力的条件。" 张予彤在本次论坛上坦言。正是这种资源约束,迫使团队转向通过大量的基础研究创新来换取极致效率。
她透露,Kimi 投入大量精力将工程化思维引入研究环节,以确保算法创新能稳定应用于生产系统。例如,Kimi 是全球首个在大型语言模型训练中跑通 Muon 优化器的公司,其自研的线性注意力机制(Kimi Linear)也在处理速度上显著超越了传统系统。
这种效率优势正在转化为社会层面的生产力平权。"AI 让专业技能平权化,释放了每个人的个体创造力。" 张予彤称。
此外,张予彤还进一步总结了中国 AI 产业实现这种效率超越的三大底层驱动力。首先是规模化市场的赋能,中国庞大的制造业与零售业提供了海量数据与复杂业务逻辑结合的独特场景,使技术能在真实生产环节中高效迭代;其次是中国社会对新技术的包容与开放态度,从新能源汽车到自动驾驶的发展历程表明,用户与企业对提升生产力的工具抱有极高的接纳意愿;最后,中国 " 基建先行 " 的思维模式以及在电力、数据中心等方面的持续投入,有效降低了能源获取成本,为技术创新提供了稳固支撑。
随着 AI 推理成本在过去一年中急剧下降,张予彤判断 " 智能 " 正成为新的通用语言,软件将走向 " 无形化 "。
她表示,未来人类无需通过复杂界面操作,只需以自然语言经由 Agent(智能体)调用功能即可。" 软件不会消失,但它将变得随手可得且‘可丢弃’。" 她预测,未来的代码将通过 " 氛围编程 "(vibe coding),只要意图清晰,AI 就能即时编写出个性化工具交付结果。
大模型行业加速竞跑
随着 AI 的成本降低和技术的不断演进,过去一年来,中国大模型行业竞争正在加速。
2026 年 1 月初,AI 大模型企业智谱(HK.02513)与 MiniMax(HK.00100)先后在香港联合交易所上市,分别被称为 " 全球大模型第一股 " 和 " 最快上市 AI 公司 "。
而月之暗面也在 2025 年末由创始人杨植麟通过内部信确认,公司完成了 5 亿美元 C 轮融资且大幅超募,当前现金持有量超过 100 亿元。尽管行业上市潮涌动,月之暗面表示短期不着急上市,也不以上市为目的。杨植麟明确,C 轮融资资金将用于 " 更加激进地扩增显卡 ",加速 K3 模型的训练和研发。另外,部分资金也将用于 2026 年的激励计划和期权回购计划。
值得注意的是,据《科创板日报》日前报道,月之暗面正推进新一轮融资,其投前估值已升至约 48 亿美元(约合人民币 335 亿元)。若此轮融资顺利完成,公司估值将再度刷新国内大模型初创企业的融资纪录。报道还引用一名知情人士消息称,月之暗面已向部分潜在投资者表示,公司目标是在 2026 年下半年启动 IPO 进程。
对此,《每日经济新闻》记者向月之暗面方面求证,但截至发稿其未对上述消息做出回应。
而对于 Kimi 下一代模型,张予彤在论坛问答环节被问及今年是否会出现新的 " 中国 AI 时刻 " 时,她笑着回应:" 我们很快就会发布一个新模型。" 据杨植麟此前透露,下一代 K3 模型可能会使用其最新的实验性架构 KDA(Kimi Delta Attention,一种线性注意力模块)的相关思路。当时杨植麟强调," 我们希望在 K3 中实现重大的架构革新,并开拓出全新的能力。"
每日经济新闻


登录后才可以发布评论哦
打开小程序可以发布评论哦