李开复：最新预训练模型Yi-Lightning超越GPT-4o，中美顶尖模型只差5个月

（图片来源：钛媒体 App 编辑林志佳拍摄）

" 前一阵声称国内六家大模型公司里有几家放弃了预训练，我们正式辟谣，零一万物绝不放弃预训练，而且我们的预训练做得又快又好。"

10 月 16 日上午，面对市场的猜测和质疑，零一万物创始人李开复开宗明义公布这段话，并宣布推出新的旗舰预训练模型 Yi-Lightning" 闪电模型 "。

据李开复介绍，在国际权威盲测榜单 LMSYS 上，Yi-Lightning 超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet，排名世界第六，中国第一。他还称，Yi-Lightning 是 " 顶级模型白菜价 "，在推理速度和价格上，Yi-Lightning 的最高生成速度提速近四成，每百万 token 仅需 0.99 元，且该定价仍有利润。

" 它是第一个在国际权威达到非常高排名、打败多数的美国大模型，成为首度超越全球头部的 OpenAI GPT-4o 的中国大模型。Yi-Lightning 闪电模型不但模型性能世界一流、推理非常快速，而且价格非常低，不论是 App 调用、还是企业应用场景调用，都是非常适合的。" 李开复表示。

会后交流时，李开复向钛媒体 App 强调，很多人问中国的预训练是否落后美国？我们也坦诚中国是落后美国，但有人说落后十年、二十年，今天我们可以用非常精确的数字来算，GPT4o 在 5 月做出来的模型，我们在 10 月的今天已经把它打败了。如果真的算中国赶超美国有多远的距离，至少，零一万物离 OpenAI 的模型，只差 5 个月。

据悉，零一万物（01.AI）成立于 2023 年 5 月 16 日，致力于打造全新的 AI 2.0 平台与 AI-first 生产力应用的全球化公司，由创新工场董事长兼 CEO 李开复创立，并担任零一万物 CEO。核心团队成员来自谷歌、微软、IBM、百度等公司。

融资层面，截至目前，零一万物已完成三轮融资，其中包括由阿里领投的 2.5 亿美元（约合人民币 18.08 亿元）Pre-A 轮融资，估值已超过 10 亿美元，跻身独角兽行列。（详见钛媒体 App 前文：《对话李开复：中美大模型差距越来越小，我 10 年不 " 套现 "》）

产品和商业化层面，零一万物主打国外 To C（消费级）付费市场、国内 To B（企业级）付费市场。

对于 B 端与 C 端的布局，李开复表示，一家大模型公司同时去做 To B 和 To C 很辛苦，需要多元化的管理方式，因为两个团队的基因不同，做事方法与衡量 KPI 也不同。To B 领域，零一万物目前主要聚焦国内市场，如餐饮领域的数字人方案；To C 领域主要布局海外，因为在国内 To C 产品的流量是一个很大的成本问题，在当下较为挑战的环境下需要谨慎判断。

其中，C 端领域，今年 5 月，零一万物发布 AI 生产力工具 " 万知 "，可速读 60 万字《马斯克传》。零一万物预计今年 To C 端营收预计可达 1 亿人民币。

李开复表示，"to C 我们主要布局海外，有几个理由：第一、当我们开始做零一万物时国内还没有合适的中文模型，我们只有在国外先尝试，尝试了一段就有了心得，就迭代了一个、两个、三个产品，这些产品现在表现有些很好，有些没有那么好，我们也在不断地调整中。我们也在观察什么时候适合在国内做什么样的产品，国内 to C 产品的流量的成本越来越高，我们也看到了有些友商的用户从十几块人民币加到三十多块人民币，近来还有相当的流失，在这样一个挑战环境里我们会非常谨慎，先不推出中国本土新的 to C 的应用，我们已有的产品还会继续维护，但更多的精力会在国外的土壤用更低廉的钱买到非常高质量的用户，或者能直接把 App 卖出去，让用户来订阅收费，这个订阅的习惯在国外也是比较良好，主要是这几个理由。现在当下最大的理由还是说国外做 to C 的产品，我们变现能力和消耗用户增长的成本算账可以算得过来，以后再关注国内有什么机会可以推出。"

如今，零一万物再度选择优化预训练模型，并且会上也首度公布了全新 ToB 战略下的首发行业应用产品 AI 2.0 数字人，聚焦国内零售和电商等 To B 业务场景。

"对于回答的生成都是靠我们 Yi-Lightning 大模型，某酒旅企业 GMV 销售额直升 170%。我觉得，大模型应用与其说卖模型或模型做客服等应用，最好的是能够有一个大模型公司看到完整的用户需求，从端到端打造一个完整的解决方案，让购买大模型和数字人的公司能立刻看到每一使用就赚钱，用得越多赚得越多，这样他对我们的付费意愿也会增长。" 李开复直言，零一万物 to B 选择做国内，是因为找到了一些破局的空间，比如用数字人来做零售、餐饮等，形成一个完整的解决方案，另外还有两三个领域开始在做，但现在还不方便披露。

李开复强调，" 全世界的范畴来说，to B 供应商基本都是当地的，跨国的设立分公司做 to B，绝对不是我们或其他的创业公司能做的，所以 to B 在国外就放弃了，做 to B 就做国内，做 to B 就做有利润的解决方案，而不只是卖模型，不只是做项目制，这是我们 to B 的做法。"

谈及成本问题，李开复称，此次预训练零一万物用了 2000 张 GPU，训练了一个半月，花费了三百多万美元，但成本约为 Grok 的 1%-2%。

李开复认为，OpenAI 是一家很厉害的公司，已发布的 OpenAI o1 虽然隐藏了所有中间的思考状态，但 o1 将此前预训练中的 Scaling 趋势扩展到推理，对行业形成认知改变，让行业认识到预训练之外，后训练 SFT（Supervised Fine-Tun-ing，监督微调）与强化训练都非常重要，" 相信很多中美公司都在向 o1 方向狂奔。" 李开复称。

谈及未来行业形势，李开复强调，公司不会放弃预训练，但这是个技术活，需要懂芯片、推理、模型、算法 " 如果一家公司能拥有这么多优秀的人才，能够跨领域合作，相信中国可以做出世界排名前十的预训练通用模型，但由于成本比较高，未来可能会有越来越少的大模型公司做预训练。

" 中国的六家大模型公司，只要有够好的人才，想做预训练的决心，融资额跟芯片都不会是问题的。" 李开复称。

以下是李开复和钛媒体 App 等部分对话信息：

问：模型做到 " 世界第六，中国第一 "，同时以较低的价格推向市场，是如何实现的？

李开复：零一万物在 Yi-Lightning 的定价上并没有亏本。

成立第一天起，零一万物同时启动了模型训练、AI Infra、AI 应用三大团队，三个团队成熟后，再对接到一起。零一万物将这一模式总结为模基共建、模应一体两大战略。AI Infra 助力模型训练和推理，以更低的训练成本，训练出性能领先的模型，以更低的推理成本支撑应用层的探索。

我们不会赔钱卖模型，但也不会赚很多钱，而是在成本线上加一点点小小的利润，就得到了今天 0.99 元 / 百万 token 的价格。

挑选模型 API 最重要的一点，是模型性能一定要优秀，在这个前提之下才去挑最便宜的，我相信，综合 Yi-Lightning 的模型质量和价格来看，Yi-Lightning 很可能是很多开发者最认可、最高性价比的模型。

问：此前有消息称，大模型 " 六小虎 "（零一、智谱、百川、MiniMax、月之暗面、阶跃星辰），其中某几家放弃了预训练。站在行业的角度，逐步放弃模型预训练会成为行业整体趋势吗？

李开复：做好预训练模型是一个技术活，而且要非常多有才华的人在一起工作，慢工出细活。需要有懂芯片的人、懂推理的人、懂基础架构的人、懂模型的人、很好的算法同学，一起做出来。

如果一个公司能有幸拥有这么多优秀的人才，能够跨领域的合作，我相信中国绝对可以做出世界排名前十的预训练的通用模型，但不是每家公司都可以做这件事情，做这件事情的成本也比较高，以后有可能会越来越少的大模型公司做预训练。

不过据我所知，这六家公司融资额度都是够的，我们做预训练的 production run，训练一次三四百万美金，这个钱头部公司都付得起。我觉得中国的六家大模型公司只要有够好的人才，想做预训练的决心，融资额跟芯片都不会是问题的。

问：零一万物首次公布 ToB 相关矩阵，未来会进一步在 ToB 方向深耕吗？

李开复：在国内，大模型 ToB 相对于 AI 1.0 时代有不同的打法，首要任务就是要寻找少数能够按使用情况收费的方法，而不是项目定制的方法。能得到比较高利润率的订单再去做。

今天零一万物推出的 AI 2.0 数字人解决方案不是做一单赔一单的做法，它专注到用户重大的痛点需求和盈利点，也就是一个店长或 KOL 平时做一次直播浪费最重要的资源——他的时间。这个时间就算做一小时直播能赚到一千块钱，也就是这一千块钱，但如果用数字人直播就不是一小时了，可能可以做一千个小时（直播），哪怕每一个小时只能赚一半的钱，一千个小时还是可以赚五百倍的钱，这样账就很好算了。

如果真的能把数字人做到端到端，只要输入公司内部的东西，选一个形象、声音按一个钮就开始直播，等于卖给这个企业一个印钞机，印钞机要收租赁费就可行。除了直播以外，我们的 AI 2.0 数字人解决方案已经跑通了更多业务场景，比如 AI 伴侣、IP 形象、办公会议等等。

整体来看，零一万物 ToB 整体解决方案会采取「一横一纵」的打法。先将单个行业做深做透，进而以自身技术能力和行业积累为基础，凝练出标准化的 ToB 解决方案，为各行各业的企业客户将本提效。

问：除了数字人解决方案，零一万物是否还有其他 ToB 解决方案？

李开复：除了我们已经发布的 AI 2.0 数字人、API 之外，零一万物目前还有 AI Infra 解决方案、私有化定制模型等其他 ToB 业务，我们会在近期正式对外发布，敬请期待。

问：零一万物在海外推出 ToC 产品，国内陆续推出 ToB 产品，当前在 B 端、C 端的产品现状如何？

李开复：一个大模型公司同时做 ToB 和 ToC 很辛苦，销售方法、利润的比例、需要多少投放才会有收入等评估体系完全不同。也需要多元化的管理方式，因为两个团队的基因不一样，做事的方法、衡量 KPI 的方法都不太一样。我在这两个领域有经验，也在试着做，但也绝对不能什么都做。

ToB 上，零一选择做国内市场，是因为找到了一些破局的空间，比如用数字人来做零售、餐饮等，能做一个完整的解决方案。另外还有两三个领域开始在做，现在还不方便披露。ToB 不做海外市场，是因为全世界的范畴里，ToB 供应商基本都是当地的。选择在国内做 ToB，还要选择有利润的解决方案做，而不只是卖模型、不只是做项目制，这是我们 ToB 的做法。

ToC 我们主要布局海外。当我们开始做零一万物时，国内还没有合适的中文模型，只有在国外先尝试，迭代了一个、两个、三个产品，这些产品现在表现有些很好，有些没有那么好，在不断地调整中。

我们也在观察什么时候适合在国内市场做什么样的产品，目前做 ToC 产品面临一个很大的问题——流量成本越来越高。我们也看到有些友商的用户从十几块人民币加到三十多块人民币，近来还有相当的流失，在这样一个环境里，我们会非常谨慎，先不推出中国本土新的 ToC 应用，同时已有的产品还会继续维护，但更多的精力会在海外的土壤用更低的成本买到非常高质量的用户，或者能直接把 App 卖出去，让用户来订阅收费，那边订阅习惯相对成熟。

换句话说，现在现状选择在海外做 ToC 产品，变现能力和消耗用户增长的成本算账可以算得过来，以后再关注国内有什么机会可以推出。

问：今年 5 月，Yi-Large 把中美顶尖模型的时间差缩短到六个月，这次 Yi-Lightning 发布直接击败了 GPT-4o，把时间差甚至缩短到了五个月，你觉得之后中美大模型如何缩短时间差？

李开复：缩短时间差非常困难，我不预测我们可以缩短这个时间差。因为毕竟人家是用十万张 GPU 训练出来，我们用的是两千张 GPU 训练出来。

Yi-Lightning 的效果是因为团队和社区大家都热心聪明去使用，去理解对方做出来的东西，再加上我们自己每家的研发有特色，比如数据处理、训推优化等等，现在这一套方法论在零一万物已经成熟了，我们有信心把自己的创新加上我们的一些特长，在关注 OpenAI 和其他公司发布的新技术，尽快地去能够了解这些技术的核心重要性，然后把它的能力在我们自己的产品里面发挥出来。

我觉得这套方法保持在六个月左右，就已经是很好的结果了。如果期待破局，可能需要一个前所未有的算法才有机会。我们千万不要认为落后六个月是一个很羞耻的事情，或者一定是要追赶的事情，因为我很多海外朋友都认为中国会远远落后，人家十万张 GPU 等，我们要被甩掉三年、五年甚至十年都有可能，现在零一万物证明了不会落后这么多，而且这次 LMSYS 的榜单上也有其他两家中国公司表现不错。

（本文首发于钛媒体 App，作者｜林志佳，编辑｜胡润峰）

宙世代

逗玩.AI

相关标签