财经涂鸦 09-11
王坚:模型权重的开放本质上是数据和计算资源的开放,AI不能缺失太空
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

" 未来把每颗卫星开放给全世界任何一个人"

作者:苏打

编辑:tuya

出品:财经涂鸦(ID:caijingtuya)

公司情报专家《财经涂鸦》获悉,9 月 11 日,阿里云创始人、之江实验室主任王坚院士在 2025 Inclusion · 外滩大会开幕式主论坛中发表主题演讲,针对当前人工智能背景下绕不开的 " 开放 " 问题进行重点解读。

他指出,开放性正成为 AI 时代推动技术进步与创新的关键因素,AI 领域也正在经历一场从代码到资源的开放革命。

回顾从互联网到 AI 的转变,开源已从技术手段演变为行业发展的必要环境。不仅如此,放眼未来," 人类探索太空的路上也不能没有计算的陪伴 "。

目前,他和团队正在探索一个有趣的机会,把每颗卫星开放给全世界任何一个人。

以下为王坚演讲原文(根据表述需求有所删减):

非常高兴有这么一次机会跟大家分享一下这个话题,在今天人工智能的背景下有一个绕不开的话题—— " 开放 "。

" 开源 " 这个词其实大家有不同的理解,我们今天正在经历一个从代码的开放、开源,到资源的开放、开源,一个非常不同的革命性变化。

如果从人工智能角度(来看),2025 年注定是非常不平凡的一年。

今年年初 1 月 13 日,美国公布了对人工智能的出口管制,第一次明确说要对人工智能模型的权重进行管制。这个管制令有一个个漏洞,他只是明确地提出了对 " 闭源 " 权重的出口管制,而专门强调了 " 开源 " 的权重不在管制之列。

我想这边后面有一个非常重要的假设,在 1 月 13 日,其实也就是大半年以前。当时,世界上最好的基础模型都是在美国头部的那几家公司。当然也有一个很有意思的事情,今年 1 月 18 日,大家都熟悉的 Jeff Hinton 也在几个星期以前到过上海,大家都知道他是一个极其反对让人工智能模型开源出来的人。

可是 1 月 31 日,随着千问 Qwen 的开源,DeepSeek 的开源,Sam Altman 说过一句让所有人都很震撼的话:在开源这个时刻,OpenAI 站在了历史的错误一边。

2025 年另一个神奇的一件事情就是,沿用了软件时代的概念,使得开源变成了今天 AI 竞争的一个很关键的变量。

对于一个产业和一个技术(来说),这个变量不是新的。1998 年,互联网要起来的时候,大家知道互联网要起来的一个最重要标志就是浏览器。大家知道 Netscape 是当时最好、最开放,也是改变了这个格局的浏览器,在互联网时代,Netscape 的开源是那个时代的 " 分水岭 "。

所以,开放的话题不只是今天重要的关键,在互联网时代也是那个关键的变量。

可能很少人知道," 开源 " 这个词在 1998 年 4 月份,才被一批极客固化下来。当时有很多不同的叫法,比如自由软件、免费软件,但是 1998 年其实离我们没有多远,它开创了后来互联网的那个时代。

谈到图灵奖, 2019 年 Jeff Hinton 和那几位开创者得了图灵奖的时候,曾在演讲上说了两个很重要的观点,和今天的开源是有关系的,即所谓逻辑驱动的,或者由大脑或者神经元等生物特性启发的这两种不同逻辑。

因为有第二个方法,所谓的用神经元 / 生物学方法来驱动的方法论演进,使得我们有了 " 权重 " 概念。

很长时间内,一直有人在探索这件事情。这篇发表在 1986 年的《自然》杂志上的文章非常明确地讲到了 " 权重 " 这件事情在模型中的重要性,并将开源概念真正固化下来。

事实上," 开放资源 " 的概念不是因为有开源这个说法而带来的,科学探索的过程中,有很多先驱已经做了这件事情。当然,我自己很高兴的是最早提出以生物学神经元为基础的方法论先行者们为我们做了非常好的探索。

这才有了后面 2012 年第一次 Hinton 跟他的两位学生把数据、模型、算力 GPU 搞在一起,这带来了大家都熟悉的人脸识别的时代。但在那时候 " 资源 " 概念还是没有那么深入人心,因为数据量不足够大,模型不足够复杂,算力也没有想象那么大。

2017 年,这一切发生了很大的变化。那时候这几位作者提出了 "Transformer" 提出了 "Tokenization",就是今天讲的 Token,大家都知道 Tokenization 是非常关键的技术,使得让数据真正资源化,这是里程碑的事情。

加上 2012 年时的数据、模型、算力乘上了一个更大的变量,当规模到这个程度的时候,资源就变成了非常重要的事情。

大家试想一下,到今天模型权重的开放本质上是数据资源和计算资源的开放,有了模型开放以后,你再也不需要自己花掉那么多计算资源重新做有人替你做掉的事情。

我想说,开放以后并不是大规模计算不重要了,而是作为个体不需要再重新发挥这么多资源,因为有人帮你付掉了这笔钱。倒过来讲,要做一个更好的模型,可能需要有其他人以更多的资源投入来完成这件事情。

所以,到了今天这个时候,只是开放源代码,其实不解决过去在软件时代解决的问题,而开放资源(特别是数据和计算资源)是让我们推动行业往前走的不能缺失的环节,这就是今天人工智能时代说 " 开源 " 非常重要的特点,我更愿意把开源叫 "Open Resource"。

另外,太空一直是我们最大的资源。今天有了通讯卫星、导航卫星、遥感卫星以后,人工智能的出现就会有第四种卫星,我把它叫 " 计算卫星 ",使得我们有机会把 AI 送到那里去。

今年 5 月 14 日,之江实验室第一次把 12 颗卫星同时上了天,而且在这 12 颗卫星组成的星座上,第一次把地面真正意义上的 8B AI 模型放到太空去了。不是用了简单的深度学习算法做了处理的小程序放到卫星上,是一个跟地面上一模一样的完完整整的 AI 模型送到了太空上。其实当第一次进去的时候还是非常激动的,所以让我们觉得第一次可以感受到 AI 是不能缺失太空的。

这 12 颗卫星到了太空以后会保证只要卫星到达的地方,就可以在太空的任何地方完成对所有数据的处理。大家知道在这之前,所有的卫星在天上是没有任何关系的,所有在天上的卫星只跟地面发生关系,天上的这颗卫星和那颗卫星之间没有关系,这也是第一次完整地做完了在太空卫星的互通互联,给人工智能在太空带来了一次巨大的机会。

为什么给它叫了个名字 " 三体计算星座 "?事实上," 三体 " 这个词并不是来源于小说,它是一个彻头彻尾的科学概念,最早是牛顿提出来的。

牛顿讲了一个非常简单的道理,在太空中如果只有两个物体,假定月亮和地球,是可以有解析解的。也就是说,有一个准确的数学解决方式来说明这两个物体之间的关系。但只要还有第三个物体存在,比如说太阳,这三个物体之间的关系就没有解析解了,就没有一个确定的解了。

所以你要描述它们之间的关系,一定要假定另外一个物体是固定不动的,后来被牛顿称为 " 三体问题 "。

而 " 三体计算星座 " 就是希望我们有 N 多主体还是可以完成一件事情的,这是开放资源的情况下必须要做到的事情。" 三体计算星座 " 就是希望有无数的主体来共同完成这个星座,来共同分享这个太空。

我们会做一个非常有意思的计划,真的把每一颗卫星开放给全世界的任何一个人。科学家们设想,几年以后,把卫星送到太阳轨道。在那个时候,数据几乎没有办法传回到地面再做处理,只有把 AI 和算力送入太空,人类才有可能真正地走出地球。

下面这个时代还是非常激动人心的。我经常讲,人类去火星的路上,是不能没有计算的陪伴和 AI,这就是下面十年甚至二十年最激动人心的地方。

谢谢大家!

本文由公众号财经涂鸦(ID:caijingtuya)原创撰写,如需转载请联系涂鸦君。

添加涂鸦君个人微信(ID:tuyaclub)

加入【公司情报社群】

参与资本市场讨论

获取一手情报

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 王坚 人工智能 互联网 ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论