Techweb 10-16
零一万物新旗舰模型 Yi-Lightning超越 GPT-4o,李开复详解背后原因
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【TechWeb】10 月 16 日消息,在辟谣 " 不做大模型预训练 " 后,今天零一万物 CEO 李开复正式发布最新旗舰模型 Yi-Lightning。

在国际权威盲测榜单 LMSYS 上,Yi-Lightning 超越硅谷知名大模型 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。

这也意味着零一万物紧随 OpenAI、Google 之后,与 xAI 打平,进击全球前三大模型企业。

目前 Yi-Lightning 已上线 Yi 大模型开放平台(https://platform.lingyiwanwu.com/),每百万 token 仅需 0.99 元。

李开复再次强调:" 零一万物绝不放弃大模型预训练,而且我们的预训练做得又快又好。"

和 Yi-Lightning 大模型同时发布的,还有零一万物的 To B 行业解决方案——行业应用产品 AI 2.0 数字人,聚焦零售和电商等场景,将最新版旗舰模型实践到行业解决方案,在弹幕互动、商品信息提取、实时话术生成等环节,AI 2.0 数字人已接入 Yi-Lightning。

至此,零一万物大模型在 To C 和 To B 端均有推出产品进行布局。李开复对 To C 和 To B 的布局的不同侧重也进行了深入解读。

李开复观点:

1、绝不放弃大模型预训练,不要认为落后美国六个月是一个很羞耻的事情

在发布会上,李开复再次提到:" 有自媒体声称国内六家大模型公司里有几家放弃了大模型预训练,网上也有很多观点认为,中国预训练赶不上美国。"

李开复再次正式辟谣:零一万物绝不放弃预训练,而且我们的预训练做得又快又好。

李开复称,在大模型预训练上,中国是落后美国,有人说落后十年、二十年。今天我们可以用非常精确的数字来算,因为 GPT4o 是在 5 月 13 日做出来的模型,零一万物在 10 月 16 日 Yi-Lightning 大模型已经把它打败了,所以就是五个月之后超过五个月前最强的模型。算中国赶超美国有多远的距离,至少零一万物只差五个月。

李开复强调,我们千万不要认为落后美国六个月是一个很羞耻的事情,因为我很多美国朋友都认为中国会远远落后,也有美国朋友包括一些中国朋友认为,按照这个打法,人家十万张 GPU,我们要被甩掉三年、五年甚至十年都有可能。现在零一万物证明了不会落后这么多,而且这次 LMSYS 的榜单上也有两家其他中国公司表现也不错,也不是只有我们一家在做。

在李开复看来,做好预训练模型是一个技术活,需要有懂芯片的人,懂推理的人,懂基础架构的人,懂模型的人,有很好的算法同学,一起做出来。不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司训练做预训练。

另外,李开复透露,这次 Yi-Lightning 的预训练只用了 2000 张 GPU、训练了一个半月,花了 300 多万美金,做出来的预训练模型能力跟 xAI 的 Grok 打平,但是只花了它的 1% 或 2% 的成本。

2、不打价格战、不做亏本生意,API" 白菜价 " 也有小利润

此次,零一万物最强大模型 Yi-Lightning 的 API 定价为每百万 token 仅需 0.99 元。

对于这个价格,李开复表示:" 我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天 0.99 元 / 百万 token 的价格。欢迎大家使用,不用担心我们被你用垮了。"

同时,李开复也再次强调:" 之前回应行业价格战时,我的回答就是零一万物不参与价格战。另外,我当时也提到,不能只看模型价格,还要看模型性能是否足够好。"

新旗舰模型 Yi-Lightning 强在哪儿?

继上半年千亿参数模型 Yi-Large 之后,这次零一万物发布的最新旗舰模型 Yi-Lightning 在国际权威盲测榜单 LMSYS 上超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中国第一。

除了在 LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现 " 超越 OpenAI GPT-4o " 的最佳成绩。

在众多分榜上,Yi-Lightning 的成绩同样出众。

在中文分榜上,Yi-Lightning 超越了 xAI 发布的 Grok-2-08-13、智谱发布的 GLM-4-Plus 等国内外优质模型,与 o1-mini 等模型并列排名世界第二。

在多轮对话分榜上,Yi-Lightning 则是超越了 Google 所发布的 Gemini-1.5-Pro 、Anthropic 发布的 Claude 3.5 Sonnet 等知名旗舰模型,排名第三。

数学能力,代码能力方面,Yi-Lightning 同样处于全球第一梯队。在数学、代码分榜上,Yi-Lightning 分别取得第三、第四名。

以专业性与高难度著称的艰难提问、长提问榜单上,Yi-Lightning 的表现依旧出众,均取得世界第四的优异成绩。

LMSYS Chatbot Arena 的用户体验评估不仅证明了 Yi-Lightning 的出色性能,也更为直观地验证了大模型解决真实世界问题的能力。这不仅证明了 Yi-Lightning 优异的模型性能,更重要的是,这也意味着 Yi-Lightning 能够丝滑地由实验室场景过渡到模拟真实用户场景,能够更快、更高质量地实现模型能力落地。

另外,与 Yi-Large 相比,Yi-Lightning 在模型性能更进一步的前提下,推理速度方面有着极大提升。

内部评测数据显示,在 8xH100 算力基础下,以同样的任务规模进行测试,Yi-Lightning 的首包时间(从接收到任务请求到系统开始输出响应结果之间的时间)仅为 Yi-Large 的一半,最高生成速度也提升了近四成。

大模型 To B、To C 应用两手抓

国内大模型赛道狂奔进入第二年,商业化造血能力已经成为多方关注的焦点。

今天,零一万物也首度公布了全新 To B 战略下的首发行业应用产品 AI 2.0 数字人,聚焦零售和电商等场景,将最新版旗舰模型实践到行业解决方案,在弹幕互动、商品信息提取、实时话术生成等环节,AI 2.0 数字人已接入 Yi-Lightning。

据介绍,接入 Yi-Lightning 后,数字人的实时互动效果更好,话术更丝滑,回复也更准确;业务数据方面,在接入 Yi-Lightning 全新加持的数字人直播后,某酒旅企业的 GMV 较此前上升 170%。

李开复表示,一个大模型公司同时做 To B 和 To C 是很辛苦的,也需要多元化的管理方式,因为两个团队的基因不一样,做事的方法和衡量 KPI 的方法都不太一样。我自己在这两个领域有经验,也在试着做,但是也绝对不能什么都做。

To B 选择做国内,李开复表示,我们找到了一些破局的空间,比如用数字人来做零售,做餐饮等等,这能做一个完整的解决方案,另外还有两三个领域开始在做,现在还不方便披露。To B 工作只能在中国做,因为要触达美国的用户或国外的用户不太可能,所以 To B 的国外就放弃了。在国内做 To B 就做有利润的解决方案,而不只是卖模型,不只是做项目制,这是零一万物 To B 的做法。

To C 零一万物主要布局海外。李开复认为,To C 的产品在国内走流量有一个很大的问题,流量的成本越来越高,有些友商的用户从十几块人民币加到三十多块人民币,近来还有相当的流失。在这样一个挑战环境里我们会非常谨慎,先不推出中国本土新的 To C 的应用,已有的产品还会继续维护,但更多的精力会在国外的土壤用更低廉的钱买到非常高质量的用户,或者能直接把 App 卖出去,让用户来订阅收费,订阅的习惯在国外比较良好。国外做 To C 的产品,目前零一万物变现能力和消耗用户增长的成本算账可以算得过来,以后再关注国内有什么机会可以推出 To C 产品。

李开复强调,而无论是 ToC 还是 ToB,如何提前预判 TC-PMF 是绕不开的核心命题。模型性能与推理成本,两项关键因素直接影响着大模型落地的成败。作为兼具性能与性价比的新旗舰模型,Yi-Lightning 也将成为零一万物探索 " 模应一体 " 的重要基石。零一万物会坚持 " 模型+AI Infra+应用 " 三位一体的全栈式布局,积极在 ToB 企业级解决方案上探索 TC-PMF,以更从容的姿态迎接即将到来的 AI 普惠时代。(果青)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

李开复 google 零一万物 美国 辟谣
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论