最近,网络上突然传出百度要放弃通用大模型研发的消息。要知道就在去年举行的中关村论坛上,百度创始人李彦宏还曾表示,"AI 大模型将改变世界,百度要做第一个把全部产品重做一遍的公司 "。毫无疑问,All in AI 是过去一年百度的基调,但这个传言直指他们突然要不做大模型了。
如此强烈的反差,自然也引得各路吃瓜群众下场。眼见这个消息越传越广,百度文心一言的市场部负责人张全文在朋友圈辟谣," 所谓‘放弃通用大模型研发’纯属谣言!文心一言刚完成了功能全面升级。我们将持续加大在通用大模型领域的研发投入。"
事实上,从百度近期的一系列动作来看,怎么看也不像要放弃大模型的样子。就在不久前,百度方面宣布文心一言 App 升级为文小言,定位百度旗下的 " 新搜索 " 智能助手,并带来富媒体搜索、多模态输入、文本与图片创作、高拟真数字人。而在两个月前,他们才刚刚发布了文心大模型 4.0 Turbo。
那么问题就来了,近年来一直押注 AI,且进入 2024 年以来也继续在大模型上投入资源的百度,关于他们要退出大模型研发的谣言为什么会有市场呢?
不同于以往的传言,这次谣言的作者用洋洋洒洒数百字给出了一个逻辑自洽的帖子。给出的理由,是下一代大模型的研发成本高昂,且当下大模型缺乏可行的变现渠道,唯独拥有现金奶牛的厂商才烧得起钱。
大模型的研发成本越来越高这件事,确实是事实。按照 Anthropic 首席执行官 Dario Amodei 此前在播客节目中的说法,该公司目前正在开发的 AI 模型训练成本高达 10 亿美元,并且他还预测,训练大模型的成本将在短短三年内就上升至 100 亿美元的水平。
同时更让 AI 厂商烦恼的,是直到今天,不光大模型本身不挣钱,使用大模型作为基座的各类 AI 应用也赚不钱,使得他们都押注下一代大模型的智能化水平会再一次出现跃迁,让 AI Agent 得以落地。从某种程度上来说,现在的大模型研发已然变成了一场 " 胆小鬼游戏 ",而在一众大厂里百度确实是最 " 胆小 " 的。
根据百度方面此前发布的 2024 年第二季度财报显示,其最大的收入来源线上广告业务该季度收入为 192 亿元、同比下滑 2%。造成这一结果的原因,是 AI 在搜索结果内的渗透率达 18%,但由于并未商业化,进而拖累了广告收入的增长。而在 B 端的百度云业务中,9% 的收入来自外部客户使用大模型及生成式 AI 相关服务,这个数字显然还不足以证明 AI 重塑了百度云业务。
最致命的风险是 Scaling Law 没有失效,以至于通用大模型的开发看起来就变成了无底洞。而 Scaling Law 是指大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关,换而言之,只要继续堆参数、堆算力,大模型的性能就会进步。例如 OpenAI 刚刚发布的 " 草莓 " 大模型(OpenAI o1),就继续验证了 Scaling Law 的有效性。
Scaling Law 对于绝大多数体量有限的大模型开发商显然不是一个好消息,因为这意味只要肯花钱,大模型就一定会进步。简而言之,现在的大模型开发已经变成了一个纯粹的氪金游戏,购买英伟达 H100 等算力卡、雇佣专业的 AI 科学家、清洗出更高质量的语料,乃至向外界宣传大模型,样样都离不开钱。
可问题在于,市值 300 亿美元、现金储备 550 亿人民币的百度在一众大厂中并不出挑,而且现在百度的 AI 战略是大模型和 AI 应用全都要。一边是 " 橙篇 "、" 文小言 ",以及智能体联盟解决方案,另一边是要在 2025 年亮相的文心大模型 5.0。相比于搞得风风火火的文小言和智能体,文心大模型在今年确实显得缺乏亮点。
月之暗面的 Kimi 开启了大模型内卷长文本的先河,幻方的 SeepSeek 消除推理时间键值缓存的瓶颈,未来极有可能会成为所有模型共同采用的优化方式。可反观百度的文心大模型,目前最强的 ERNIE-4.0-Turbo-8K 旗舰级模型在跑分上也已经成为了追赶者。
因此这样看来,放弃大模型是一个在商业层面说得过去的决策。只不过如果百度真的选择放弃大模型的研发,就意味着它要从牌桌上下来,这对于百度的品牌价值而言就会是一个巨大的打击。要知道早早打出 "All in AI" 的百度,一直都是国内 AI 赛道的领跑者,放弃大模型就等于放弃了通往未来的船票。
当年百度已经为错失移动互联网时代付出了巨大的代价,如果现在真的要继续放弃 AI 时代的入场券,恐怕接下来 "BAT" 的含义就要变了。
【本文图片来自网络】
登录后才可以发布评论哦
打开小程序可以发布评论哦