新智元 10小时前
十三年布局,一朝反超,谷歌AI崛起的真实故事
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2025 年 8 月,一个叫 Nano Banana 的图像生成器冲上 LMArena 榜首,后来 Gemini App 成为苹果商店下载量第一,OpenAI 内部发出 Code Red。但很少有人知道,这场逆袭的起点是 2012 年太浩湖赌场酒店的一场秘密竞拍。此后十三年,Google 收购 DeepMind、发明 Transformer、自研 TPU 芯片、经历 ChatGPT 冲击和 Bard 翻车,直到创始人 Sergey Brin 回归、核心人才 Noam Shazeer 归来,才在 2025 年完成反超。这是一个关于人才、时间与长期主义的故事。

2025 年 8 月的一个凌晨两点半。

谷歌的 AI 项目经理 Naina Raisinghani 正坐在电脑前,准备把 DeepMind 实验室的最新成果——一个超快的图像生成器——上传到 LMArena 排名平台。

系统需要一个名字才能提交。

这个点没人在线。

于是她随手用朋友给她起的两个外号拼了一个:Nano Banana。

几天后,Nano Banana 冲上排名榜首,在 X 上成为热门话题,全球用户生成了数十亿张图片。

谷歌一度找不到足够的算力,只能紧急借用服务器。

负责人 Josh Woodward 后来把这次发布称为「成功的灾难」。

到 9 月,Gemini App 成了苹果应用商店下载量第一。11 月,谷歌发布了迄今最强的 Gemini 3 模型,在多项指标上超越 ChatGPT,股价大涨。

消息传回硅谷的另一端,OpenAI 内部发出了 Code Red。

如果说人工智能是一场马拉松,那么谷歌刚刚完成了一次史诗级的冲刺。

但很少有人知道,这场逆袭的起点,要追溯到十三年前一家赌场酒店的 703 号房间。

太浩湖的赌注

2012 年 12 月初的一天,一场秘密竞拍正在美国滑雪胜地太浩湖(Lake Tahoe)的一家赌场酒店里进行。

太浩湖位于加州和内华达州交界处,是北美最大的高山湖泊,拥有蓝宝石般的湖面和顶级雪道。

《教父 2》曾在这里取景,马克吐温曾在此地流连忘返。

由于离旧金山湾区只有 200 多英里,这里被称为硅谷的后花园——扎克伯格和埃里森都在此圈地占山,兴建豪宅。

但这一天,硅谷的大佬们没有来滑雪。他们在竞拍一个人。

秘密竞拍的对象,是一家刚刚成立 1 个月、仅有 3 名员工的公司—— DNNresearch。

它没有任何有形的产品或资产,但追求者的身份暗示出了它的分量:谷歌、微软、DeepMind 和百度。

65 岁的 Geoffrey Hinton 坐在酒店 703 房间的地板上。他苍老、瘦削,饱受腰椎间盘的疼痛折磨——不能开车,也不能坐飞机。这位多伦多大学教授是深度学习领域的宗师级人物,从 1972 年进入爱丁堡大学算起,他已经在这条路上鏖战了 40 年。

他为竞拍设置了规则:起价 1200 万美元,每次抬价至少 100 万美元。

几个小时后,价格被推到了 4400 万美元。辛顿有些头晕,感觉「我们像是在拍电影」。他果断喊停,把公司卖给了最后的喊价者——谷歌。

有意思的是,这场 4400 万美元竞拍的源头之一,正是来自 6 个月前的谷歌。

「谷歌猫」与最老的实习生

2012 年 6 月,谷歌研究部门 Google Brain 公开了一个叫「谷歌猫」的项目成果。

简单来说,这个项目就是用算法在 YouTube 的视频里识别猫。

它由从斯坦福跳槽来谷歌的吴恩达发起,拉上了谷歌传奇人物 Jeff Dean 入伙,还从创始人 Larry Page 那里要到了大笔预算。

谷歌猫搭建了一个神经网络,动用了遍布谷歌各个数据中心的 16000 个 CPU 进行训练,最终实现 74.8% 的识别准确率。

这一数字震惊业界。

但吴恩达在项目临近结束前激流勇退,投身自己的互联网教育项目。临走前他向公司推荐了辛顿来接替他的工作。

面对邀请,辛顿表示自己不会离开大学,只愿意去谷歌待一个夏天。

由于谷歌招聘规则的特殊性,时年 64 岁的辛顿成为了谷歌历史上最年长的暑期实习生。

这位实习生了解了谷歌猫项目的技术细节后,马上看到了项目成功背后的隐藏缺陷。他后来说:他们运行了错误的神经网络,并使用了错误的计算能力。

同样的任务,辛顿认为自己可以做得更好。

于是在短暂的实习期结束后,他马上投入行动。

辛顿找来了自己的两个学生—— Ilya Sutskever 和 Alex Krizhevsky,两人都是出生于苏联的犹太人,前者极具数学天赋,后者擅长工程实现。三人密切配合,创建了一个新神经网络,参加了 ImageNet 图像识别大赛。

2012 年 10 月,辛顿团队的冠军算法 AlexNet 以惊人的 84% 识别准确率夺冠。

相比谷歌猫用了 16000 颗 CPU,AlexNet 只用了 4 颗英伟达 GPU。

学术界和产业界彻底轰动。

AlexNet 的论文成为计算机科学史上最有影响力的论文之一,目前被引次数已经超过 12 万。而谷歌猫则被迅速遗忘。

太浩湖的 4400 万美元,给全球的深度学习大神做了一次重新定价。在那个价格面前,图灵奖的 100 万美元奖金看起来都像是零花钱。

天下英雄尽入彀中

谷歌在拿下辛顿团队后再接再厉。

2014 年 1 月,谷歌以约 6 亿美元收购了当年在太浩湖竞拍中与之竞争的 DeepMind。

这家伦敦公司的创始人 Demis Hassabis 是一个国际象棋神童,4 岁开始接触国际象棋,14 岁成为国际象棋大师。

马斯克曾向谷歌创始人 Larry Page 推荐了自己投资的这家公司。

为了能带上辛顿一起去伦敦验证 DeepMind 的成色,谷歌团队专门包了一架私人飞机,并且改造了座椅——因为辛顿的腰椎问题让他无法乘坐普通飞机。

收购完成后,谷歌的 AI 版图上已经聚集了当时最顶尖的深度学习人才。

与此同时,一个不太引人注目的项目正在悄悄进行:谷歌开始自研 AI 芯片。

他们认为语音识别这类应用会需要大量算力,于是设计了 TPU(张量处理单元),比传统 CPU 和 GPU 更省电。

这一步棋当时看起来并不显眼。

但十多年后,它将成为谷歌反超的关键武器。

Transformer:改变世界的论文

2016 年 3 月,DeepMind 的 AlphaGo 以 4:1 击败围棋世界冠军李世石,震惊全球。

这是 AI 第一次在这种极其复杂的策略游戏中战胜人类顶尖选手。

那一年,Sundar Pichai 刚接任谷歌 CEO 不久。他在博客里写道:过去十年是智能手机的时代,未来十年将是 AI 优先的时代。

2017 年 6 月,谷歌的一个团队发表了一篇名为《Attention Is All You Need》的论文。8 位谷歌科学家提出了 Transformer 模型——一种彻底抛弃循环神经网络、完全基于注意力机制的新架构。

这篇论文开启了如今的大模型时代。ChatGPT、Claude、Gemini…… 所有当今最强大的 AI 模型,都建立在 Transformer 的基础之上。

截至 2025 年,这篇论文被引用超过 17.3 万次,位列 21 世纪被引用最多的论文前十。

但讽刺的是,8 位作者后来全部离开了谷歌,创办或加入了其他公司。

其中一位叫 Noam Shazeer。

记住这个名字。

ChatGPT 的冲击

尽管谷歌拥有最强的技术积累和最顶尖的人才,但在聊天机器人这条赛道上,它一直表现得异常谨慎。

2021 年 5 月,谷歌发布了 LaMDA ——一个基于 Transformer 的对话大模型。

但它只对少数人开放测试,限制极多。2022 年 8 月,谷歌推出了测试应用 AI Test Kitchen,有三个功能:想象它、列出它、聊狗。

没错,第三个功能只能聊狗。

谷歌的高管和研究员们担心安全问题。早期模型很容易被诱导出种族歧视或性别歧视的回答。前 Google Brain 员工 Julia Winn 说,谷歌对这类风险看得比她待过的任何公司都重。

这种谨慎让一些研究员很沮丧,有的选择了离开。

然后,2022 年 11 月 30 日,OpenAI 发布了 ChatGPT。

五天内,一百万人注册。用户没有太多限制,想聊什么聊什么。

谷歌内部一些在 AI 上耕耘多年的员工气坏了。

分析师和投资者开始质疑:谷歌是不是要错过科技史上的下一波大浪?

翻车

2023 年 1 月,Jeff Dean、Demis Hassabis 和新加入的机器人专家 James Manyika 向董事会汇报了打造最强模型的计划。

但谷歌等不及了,需要先推一个产品出来。

2023 年 2 月 6 日,他们匆忙发布了基于 LaMDA 的聊天机器人 Bard。

发布会翻车了。

宣传视频里,Bard 被问到韦伯望远镜的问题,回答说它拍了第一张系外行星照片。

这是错的。第一张系外行星照片是 2004 年欧洲南方天文台的甚大望远镜拍摄的。

Alphabet 股价当天下跌 8%,市值蒸发约 1000 亿美元。

这是谷歌 AI 历史上最黑暗的时刻之一。

创始人的回归

差不多同一时间,已经退休的谷歌联合创始人 Sergey Brin 在一个派对上碰到了 OpenAI 的研究员 Daniel Selsam。

Selsam 问他:ChatGPT 这么厉害,作为计算机科学家你不心动吗?怎么不回来全职搞 AI?

Brin 觉得他说得有道理。

这位 2019 年从执行层退休的联合创始人,开始几乎每天参与 AI 工作。

他深入了解技术细节,研究损失曲线,每周参与前沿 AI 研究的讨论。他还帮 Gemini 挑毛病,并且参与了关键人才的招聘。

Brin 后来说:任何计算机科学家现在都不应该退休。

他还促成了一笔关键的交易。

Noam Shazeer 是 2017 年 Transformer 论文的 8 位作者之一。

他后来离开谷歌,与 Daniel De Freitas 共同创办了 Character.AI ——一家专注于 AI 角色对话的创业公司。

这两个人还有另一个共同点:他们都是 LaMDA 的关键开发者。

2024 年 8 月,一个价值 27 亿美元的交易让这两位叛将回归了谷歌 DeepMind。

严格来说,这不是一次收购—— Character.AI 继续独立运营,但 Shazeer、De Freitas 和约 30 名研究人员回到了谷歌。

谷歌要回的不是公司,是人。

这两人后来参与领导了 Gemini 的开发。

整合

2023 年 4 月 20 日,Sundar Pichai 宣布了一个重大决定:Google Brain 与 DeepMind 合并,成立新的谷歌 DeepMind。

这两个团队此前一直分头运作,文化也不相同。Google Brain 偏研究,总部在美国;DeepMind 偏产品,根基在英国。两边合并后产生了不少摩擦。

但在 ChatGPT 的压力下,谷歌别无选择。

Demis Hassabis 被任命为谷歌 DeepMind 的 CEO。Jeff Dean 转任首席科学家。

与此同时,谷歌有一个 OpenAI 没有的优势:OpenAI 需要融资,而谷歌可以从自己每年几百亿美元的利润里拿钱做研发。

2023 年底,谷歌发布了第一版 Gemini。

与 ChatGPT 主要用文本训练不同,Gemini 从一开始就用文本、代码、音频、图像和视频一起训练。

这是技术野心更大的方案,虽然开发时间更长,但后来被证明是值得的。

诺贝尔奖

2024 年 10 月,Demis Hassabis 和 John Jumper 因 AlphaFold 获得诺贝尔化学奖。

AlphaFold 解决了困扰科学界 50 年的蛋白质折叠问题——仅凭氨基酸序列就能准确预测蛋白质的三维结构。

这是 AI 对基础科学的历史性贡献。

对谷歌来说,这是一个转折信号:他们的科学家正在拿诺贝尔奖,而不只是追着竞争对手的尾灯跑。

关于这个故事,欢迎收看我认为目前最精彩的纪录片。

《The Thinking Game | Full documentary | Tribeca Film Festival official selection》

十年前的伏笔

2025 年 4 月,谷歌发布了第七代 AI 芯片 Ironwood。

每颗芯片可达 4,614TFLOPs 的 FP8 性能。

最多 9,216 颗芯片可以互联成一个超级算力集群,总性能达到 42.5Exaflops ——这是当时世界最强超级计算机 El Capitan 的 24 倍。

比第一代 Cloud TPU 能效提升了 30 倍。

当谷歌在 2013 年开始秘密研发 TPU 时,没有多少人意识到这步棋的意义。

那时候,Nvidia 的 GPU 还是 AI 训练的绝对霸主;那时候,ChatGPT 还不存在;那时候,大多数人连大语言模型这个词都没听说过。

但十二年后,这步落子终于开花结果。

消息传出:谷歌正在和 Meta 谈判,要卖给他们价值数十亿美元的 TPU 芯片。

Nvidia 股价当天下跌 7%。

成功的灾难

2025 年 8 月,Nano Banana 横空出世。

这个随手起的名字冲上了 LM Arena 排名榜首。全球用户疯狂使用,生成了数十亿张图片。谷歌的服务器一度不堪重负。

负责人 Josh Woodward 把这次发布称为成功的灾难。

到 9 月,Gemini App 成为苹果应用商店下载量第一。月活用户从 7 月的 4.5 亿涨到了 10 月的 6.5 亿。

11 月,Gemini 3 发布。在多项基准测试中超越 ChatGPT。自研的 Ironwood 芯片大幅降低了 AI 模型的运行成本。

Pichai 在 12 月的内部备忘录里写道:我们以很棒的姿态结束了 2025 年。想想一年前我们在什么位置,这个进步令人难以置信。

逆袭的逻辑

谷歌用了十三年完成这场逆袭。

从 2012 年太浩湖的 4400 万美元竞拍,到 2014 年收购 DeepMind,到 2017 年发表 Transformer 论文,到 2023 年经历 Bard 的翻车和团队的整合,再到 2025 年 Gemini 3 的登顶和芯片业务的突破。

期间有无数次可能走岔的路口:

如果 2012 年百度而不是谷歌赢下了辛顿,历史会怎样?

如果 8 位 Transformer 作者没有全部离开谷歌,会怎样?

如果 Sergey Brin 没有在那个派对上被一句话刺激到,会怎样?

如果 Noam Shazeer 没有回归,会怎样?

但历史没有如果。

尾声

回看这十三年,有一个贯穿始终的主题:人才。

太浩湖的秘密竞拍抢的是人。收购 DeepMind 买的是人。Sergey Brin 回归是人的回归。Noam Shazeer 的 27 亿美元交易,本质上还是请人回来。

在前沿技术领域,一个顶级学者的作用,往往大过一万个普通工程师。这就是为什么谷歌愿意花 4400 万美元买下一家没有产品、没有收入、只有三个人的公司。这就是为什么 Brin 愿意从退休生活中走出来。

而另一个主题是:时间。

TPU 芯片从 2013 年开始研发,到 2025 年成为竞争优势,中间隔了 12 年。Transformer 论文发表于 2017 年,但它的全部威力要到 2022 年 ChatGPT 发布后才被世界看见。深度学习的先驱们从 1970 年代就开始了探索,却要等到 2012 年才迎来产业化的曙光。

伟大之所以为伟大,不是因为其横空出世时的惊艳,而是因为它要在无边黑暗中,忍受漫长的籍籍无名与不被理解。直到多年之后,人们才能顺着这些标尺,感叹那时群星璀璨,天才辈出。

2025 年末,AI 竞赛远没有结束。OpenAI 后来也发布了更强的 ChatGPT,用户量仍然远超 Gemini。这场马拉松还在继续。

但至少,谷歌已经证明了一件事:

即使是科技巨头,也可以从落后中爬起来。即使是 ChatGPT 的冲击,也没有把谷歌打倒。

只要有人才,只要有耐心,只要有足够长的时间线,逆袭永远可能发生。

毕竟,Nano Banana 这个名字,不过是一个项目经理在凌晨两点半随手起的。

而它背后,是十三年的布局——和无数个不眠之夜。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 nano 扎克伯格 deepmind 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论