对话面壁CEO李大海：端侧AI模型赶上GPT-4，国产芯软件要补课

智东西

作者 | 江宇

编辑 | 漠影

智东西 6 月 12 日报道，刚刚，在智源大会期间，面壁智能 CEO 李大海与 AI Infra 负责人李宇轩与智东西等媒体进行了深入交流。从端侧模型进展、国产算力适配、智能体落地、开源策略到汽车、手机等终端场景，李大海回应了外界关注的多个问题，并抛出不少关键判断：

1、端侧模型进展：此前预测 2026 年底端侧模型智能水平达到 GPT-4 水平，如今已经提前达到。

2、端侧落地：2025 年是端侧模型落地元年，汽车量产是重要标志，今年会有更多端侧应用落地。

3、端侧角色：面壁会持续发布端侧基础模型，同时服务重要设备厂商，也会探索 AI 原生端侧设备。

4、智能体：很多场景已经可以落地，但外界对零介入、100% 完成、100% 负责的期待仍然偏高。

5、手机智能体：端侧模型与智能体结合，重要方向是改变人与设备的交互方式。

6、国产算力：国产芯片用于训练还需要模型公司与芯片公司更深合作，软件生态仍需补课。

7、开源：开源是高效商业模式，可以用更低成本触达潜在客户，其核心竞争力仍在 " 冰山之下 "。

8、端侧 AI 终局：长期看，模型与芯片会走向更深协同，甚至模型公司也可能生产自己的芯片，但这仍是较远的终局。

一、端侧模型提前追上 GPT-4，落地还要等芯片一起跟上

在近四十分钟的群访中，李大海和李宇轩回答了十余个问题。

我们将关键问题整理如下：

Q1：2024 年曾预测，到 2026 年底端侧模型智能水平可以达到 GPT-4 水平。现在看，这个目标会提前还是延后？

李大海判断，这个目标已经提前达到。

他提到，面壁近期发布 MiniCPM-5 1B 版本后，在 Artificial Analysis 榜单上拿到 17.6 分。社区研究者对比发现，2024 年 5 月 OpenAI 发布的 GPT-4o 在该榜单上得分大约只高零点几分，而 GPT-4o 参数规模约为 200B，MiniCPM-5 1B 只有 1B 参数。

李大海认为，这说明面壁仍在践行其提出的 " 大模型知识密度定律 "。

Q2：端侧模型现在落地到哪些生活场景？为什么用户感知还不强？

李大海认为，2025 年可以算作端侧模型落地元年，面壁去年四季度在汽车上正式量产，是一个重要标志。

他提到，目前端侧模型能力增长很快，但真正往下落地时，最大制约仍然是模型与芯片的结合。现在一批国产存算一体端侧 AI 芯片公司正在流片，一旦芯片回来，能够提供更有竞争力的功耗、算力和带宽，端侧应用会有更多爆发。

在他看来，今年会有大量端侧应用落地。以 " 小龙虾 " 这类形态为例，合理方式不是所有推理都放在云端，而是上下文管理放在端上，一部分高频推理也放在端上，最终形成端云协同。

Q3：面壁在端侧模型领域的长期定位是什么？

李大海说，面壁对自己的定位是 " 端侧模型的基础设施 "。

具体来看，面壁会做三层事情：第一，持续发布世界领先的端侧基础模型，赋能更多开发者；第二，直接服务一些出货量大的重要设备厂商；第三，在新的 AI 原生端侧设备上探索自己的硬件产品。

二、智能体已经能落地，但 " 零介入 " 还需要时间

Q4：面壁怎么看智能体当前的局限？最大问题是成本、稳定性、记忆，还是权限？

李大海认为，智能体正在快速进化。若要说问题，" 哪哪都是问题 "，但从技术发展角度看，模型与智能体的结合正在以很快速度推进。

他提到，面壁早在 2024 年就已经用智能体技术，在人工智能辅助审判方向协助法官落地。

不过，李大海也提到，外界对智能体的期待可能偏高，比如希望它零介入、100% 做好，并且还能 100% 负责。他认为，技术打磨需要时间，这是自然规律。

Q5：怎么看豆包手机这类把智能体放到手机上的尝试？

李大海认为，这是非常自然的方向。

他解释说，端侧模型的重要方向之一，就是改变人与设备的交互方式。端侧模型更隐私友好，实时性和可靠性也更强，因此适合承担人机交互任务。

他还用云游戏做了类比：云游戏一直不温不火，一个重要原因是用户对交互帧率和稳定性要求很高，不希望出现无预期卡顿。类似地，人与设备交互也需要很高实时性和可靠性，这些能力更适合在端上完成。

Q6：做端侧智能体会遇到哪些困难？

李大海说，关键仍然是模型与芯片的结合。

他把问题概括为三个因素：能力、成本和场景。一个场景能不能落地，要看模型表现、可接受成本和具体应用场景之间能否匹配。目前限制主要来自芯片、内存和带宽，但在端侧摩尔定律和端侧模型知识密度定律共同推动下，这些问题正在改善。

三、国产算力开始进入训练环节，软件生态还要补课

Q7：依托国产智算集群做训练和推理时，如何提高算力利用率？如何与国产 AI 芯片厂商、智算中心、算力服务商协作？

李大海说，过去行业更多用英伟达芯片和集群做训练，推理逐步转移到国产芯片上。今年开始，训练工作也在逐步转向国产卡。

他坦言，相比英伟达集群，国产芯片集群在软件生态上还有很多课要补，模型公司不能完全靠自己完成所有适配工作，需要芯片公司提供更多支持。

李大海提到，面壁一方面与国产芯片公司做深入配合，另一方面也与智源主导的 FlagOS 软件生态有深度合作。前者更像是模型训练牵引下的逐步完善，后者则是自顶向下做顶层规划，把芯片公司拉进来，明确哪些工作更重要，再一步步推进。

李宇轩补充说，训练相比推理，对精度要求更高。如果一张卡只做过推理、没有做过训练，可能会遇到一些意想不到的精度问题。

面壁此前提出 " 模型风洞 " 技术，即用小模型实验预测大模型效果。李宇轩说，面壁把这套基础设施先在华为等国产卡上做深度评测，并与英伟达进行对齐，确认精度可用，再继续推进更大模型训练。

Q8：此前提到在昇腾上达到 95% 训练效率，另外 5% 差距来自哪里？

李宇轩澄清说，这里的 95% 并不是指华为平台相对英伟达平台达到 95%，而是指在华为平台上，极低位宽量化感知训练相比普通训练达到 95% 的效率。

他解释，训练量化模型时需要加入量化器，这会带来额外开销和性能损失。面壁与华为合作优化量化器开销，将损失控制在 5% 以内，从而验证极低位宽训练 pipeline 在华为平台上可用。

四、苹果端侧 AI 落地不算早，手机厂商差距还没拉开

Q9：怎么看苹果推出端侧大模型？会不会挤压高端安卓手机市场？

李大海认为，苹果早在 2024 年 6 月就公布了端侧模型与云端协同战略。以苹果的风格来看，今天才落地，已经晚于行业预期。

他还提到，苹果在大模型上与谷歌有较深合作，这反而凸显出第三方专业大模型公司的价值。

李大海认为，这件事与安卓还是苹果没有本质关系，更重要的是是否找到更好的芯片，以及是否在场景和产品定义上做出更好设计。以他的观察，国内手机厂商对这一方向理解都较深，差距并不大。

Q10：手机厂商选择面壁，主要看重哪些因素？

对此，李大海总结了三点。

第一，面壁能持续训练出知识密度足够高的端侧模型。第二，面壁与很多端侧芯片公司有深度合作，比如与高通已经形成全球战略合作，并达到协同设计程度。第三，面壁在高效推理上积累较多，这对手机、汽车等功耗敏感设备很重要。

他说，在同等效果下，如果推理功耗能显著降低，就是巨大的竞争优势。

Q11：端侧模型压缩是否有极限？

李大海说，据他了解，1.58 比特应该已经算是极限。更重要的是，在这样的压缩比下，保持足够少的性能损失。

他提到，李宇轩团队主导的工作，是在训练阶段就把三值量化作为量化感知训练的一部分，从训练第一步就持续考虑和对齐，这对降低量化损失很重要。

五、开源不是简单开放技术，而是降低客户验证成本

Q12：中国大模型公司出海时，如何平衡自主可控与全球开放合作？

李大海认为，这两个方向不冲突。

他解释说，自主可控是企业对自身底层能力的内生要求；开放合作则体现在灵活商业合作模式、重视用户和客户利益，以及尊重海外客户和伙伴的文化与需求。

他同时强调，开放不等于无底线开放自己的技术，技术对外输出与开放合作是两个层面的概念。面壁会在国家技术出口相关指导方针下推进海外合作。

Q13：行业竞争激烈，面壁为什么仍然坚持开源？

李大海认为，开源是一个非常高效的商业模式，因为它能用更低成本触达潜在客户。

他说，当客户做基础研究或技术验证时，如果模型是开源的，就能低成本试用，也能帮助客户在内部用更扎实的数据和证据说服上级，最终提升从技术影响力到商业合作的转化效率。

对于开源是否会培养竞争对手，李大海认为，开源模型和框架会产生影响，但不会产生特别实质的影响，因为一家公司的核心竞争力在 " 冰山之下 "。已经开源出来的东西，不足以让别人完全学会公司的核心能力。

他还提到，企业不能只靠把一时的竞争优势关起来，而应靠技术前瞻性和速度，持续构建更复杂的竞争优势。

六、汽车、手机、无人机、潜水器都在落地，法律场景也在推进

Q14：过去一年，面壁主要有哪些进展？未来规划是什么？

李大海说，过去一年，面壁在资本市场、技术和产业落地上都有进展。

资本层面，面壁获得了更多投资人支持，其中包括具有国家队属性的资本和产业资本。李大海认为，这些融资是产业推进的结果，不是原因。

技术层面，面壁持续推进基础模型、数据治理、AI 训练 AI 框架等工作，并推出了流式全双工端侧全模态模型。

产业层面，除了智能汽车，面壁也把端侧模型部署到手机上，并在无人机、潜水器等智能终端上推进端侧模型落地。李大海称，这些方向可以概括为 " 上天入地、上天下海 "。

此外，面壁在法律领域的工作也在继续推进。李大海提到，面壁协助最高人民法院做的全国法院 " 一张网 " 试点，今年已经落到全国 20 到 30 个城市。

Q15：汽车场景中，用户和车企反馈如何？

李大海以吉利银河 M9 为例说，面壁上车的功能并不是默认开放，需要用户主动打开。车厂反馈显示，用户主动打开比例非常高。他认为，这代表了用户对相关功能的认可。

七、端侧 AI 终局可能是模型与芯片深度合一，但不会很快到来

Q16：端侧 AI 的终局是模型适应芯片，还是芯片适应模型？面壁的护城河是什么？

李大海判断，未来终局可能是 " 模型即芯片 "，即大模型公司最终生产出自己的模型后，也会同时生产自己的芯片。

不过他认为，这仍是较远的终局，可能需要 10 年起步。原因在于模型侧可以跑得很快，但芯片流片背后仍有大量不能被 AI 自动完成的工作。

李大海提到，面壁已经初步完成用 AI 训练 AI，下一步自然会考虑如何用 AI 去流片。但 AI 流片要克服的问题更多，不会很快到来。

宙世代

一起剪