数智前线 昨天
AI新王与旧王:一场围绕着数据飞轮的战争
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

谁能更快转动那个飞轮?

文|徐鑫

编|任晓渔

时隔三年,大反转。

上周一,OpenAI CEO 山姆 · 奥特曼在内部宣布启动 " 红色代码 " 行动,推迟其他一切产品开发专注 ChatGPT,以应对来自谷歌和其他对手的冲击。三年前此时,ChatGPT 刚问世,拉响红色警报的是谷歌这家老牌人工智能巨擘。

攻守易势,恰恰映射出 AI 竞争当下进入的新周期。

OpenAI 拉响警报,在于这些大模型赛道的开启者,突然发现自己通过不断定义新战场,圈用户建生态形成的领先优势,正被人工智能旧王谷歌所逐渐侵蚀。

拉长时间线看,相比 OpenAI 这类在算法层面夺得先声的公司 , 谷歌拥有的场景和生态能力当下在拉锯战里占据主动。场景 - 数据与大模型转动起来的效果超出了 OpenAI 的预期。

在国内,同样的情形也在上演。可灵凭借着快手在 APP 时代的数据沉淀和场景快速从视频生成赛道脱颖而出,而快手又为可灵健康造血以及模型迭代提供了闭环场景。群核科技凭借着应用时代积累的海量物理正确的三维数据,在空间智能时代在全球崭露头角。甚至最近大火的豆包手机,也让许多人意识到 APP 场景、数据在 AI 时代也关乎大模型能力闭环。

国内外无论是 AI 原生玩家还是老牌巨头,都在纷纷加速基于场景,构建从数据 - 模型到生态能力的闭环。

而那些能在竞争里将 " 场景理解 " 有效转化为 " 智能理解 " 的企业,有望率先定义 AI 战争的下一章。

红色警报背后,新王是旧王?

时隔三年,硅谷再次响起了红色警报。

8 月问世的 Nano Banana 以刷屏级表现驱动了 Gemini 的用户规模增长。9 月 13 日,Gemini 成功登顶美国地区 AppStore 免费榜总榜,并于同日在其他 77 个国家和地区免费榜位居第一。

11 月谷歌在官方博客中提及 Gemini 月活跃用户突破 6.5 亿,这个数字较 7 月谷歌财报发布时公布的 4.5 亿月活用户(相比此前季度 50% 增长)再出现大幅增长,显著缩小了与 ChatGPT 的 8 亿月活差距。

人工智能之父 Hinton 日前对 BusssinessInsider 鲜明表达了对这场战争的态度,他甚至惊讶于谷歌到现在才翻身," 谷歌制造自己的芯片,有很多非常优秀的研究员,显然还有大量数据和数据中心 ",因此谷歌会赢得战争。

一位 AI 行业资深人士告诉数智前线,场景和数据优势在当下的智能竞争中是很重要的一环。谷歌此前的应用场景里沉淀了大量用户搜索意图数据,天然适配强化学习技术。用户基于搜索的结果会有行为反馈,比如十个结果会点几下,这种 " 决策 - 结果 - 反馈 ",完美适配 RLHF/RLAIF。在 Scaling Law 越来越重视后训练强化学习的背景下,它对模型智能至关重要。

可以说,AI 战争,已经不再是单一维度的模型参数规模的竞争,应用时代的积累的生态与分发优势、技术与数据的闭环,产品协同与场景落地,都左右着局势。

无独有偶,国内战场,同样的情形也在上演。

无论是千问期望协同阿里体系内高德、闪购等生态力量,打造一个会办事的 AIToC 入口,还是豆包手机的 Agent 奇袭手机 APP 引发一众超级应用弹压,都显示出,AI 时代的硝烟与上一个时代的战局有着千丝万缕的联系。

实际上,视频生成领域去年已经上演过类似的脚本。

去年 2 月 Sora 的 Demo 视频让生成的人物、场景第一次真正地动了起来,而不再是有动效的图片,OpenAI 很自然地成了赛道的定义者。

之后的几个月里,海内外各路玩家及新兴创业团队纷纷推出视频生成类产品。去年 6 月,快手加入赛道,第一次凸显出了场景和数据优势对战局的影响。

不同于当时 Sora 是期货,可灵能真正试用,且效果经验,生成时长还达到分钟级,这种节奏超过了原先的赛道定义者 OpenAI。快手官方今年 8 月在财报发布会上提到,可灵 AI 单季度收入突破 2.5 亿元。

与之对比,OpenAI 的 Sora1 去年 12 月才上线,Sora2 今年 9 月 30 日上线,推出后虽然收获了一大票称赞,但这位曾经的市场教育者要从 " 玩具 " 进化成 " 工具 " 挑战重重——最近 a16z 合伙人 Olivia Moore 展示了一张 APP 数据监测服务商 Sensor Tower 的截图显示,Sora 的 30 天用户留存率 1%,60 天用户留存率接近 0%。

拥有场景和应用生态在 AI 时代的价值由此可见一斑。快手此前并不算 AI 第一梯队玩家,但基于 APP 时代海量的场景沉淀和数据积累,快手沿袭 Sora 探出来的路,成功打造了一款有全球影响力的产品。

这也让很多分析人士看到,中国过去十余年数字经济发展所沉淀下来的多元,丰富的场景及数据优势在当下 AI 竞争里的价值和意义。同时,一些人认为,应该重估那些上一个应用时代拼出来的场景和数据的价值。

不过,这当然并不意味着仅凭数据和场景就能自动赢得战争。局势的真实情况就像谷歌和 OpenAI 的位置轮替一样,基模更迭如同出回合制决斗,各方都在加速补课,看谁能更快转动那个飞轮。

是 AI 原生玩家们基于 AI 原生能力穿透用户心智,构建出用户与 AI 迭代的闭环,还是上一个时代的老炮们依托场景数据积累,快速将场景和数据优势转换成模型优势,比拼的还是决心、敏捷和执行力。

一场围绕着数据飞轮的缠斗已经打响。

空间智能,呼唤智能飞轮

作为 AI 发展演进的前沿赛道以及人工智能的下半场,空间智能领域里同样的逻辑正在复现——场景、数据和智能能否形成迭代闭环,正关乎行业能否加速从实验室走向产业规模落地。

一位行业资深人士告诉数智前线,目前整个空间智能领域可以类比为大语言模型的 GPT-2 阶段。在这一阶段里,技术路线激烈碰撞,基础能力还在积累,行业的 Scaling Law 仍待发现。

全行业需要努力实现技术路线收敛,同时破解高质量大规模的 3D 数据稀缺瓶颈,基于场景加速数据 - 模型迭代,才能推动空间智能的涌现。

用更直白的话说,整个行业都在呼唤着空间智能领域能构建起一个数据飞轮。

行业内玩家正从不同层面来加速这一进程。

比如人工智能教母李飞飞的世界模型 Marble、GoogleDeepMind 推出的世界模型 Genie3、Meta 的三维重建模型 SAM3D 和国内的腾讯混元 3D 世界模型以及英伟达的 Cosmos 世界基础模型(WFM)等,它们的能力涉及到空间的重建、生成、推理、交互等多个层面。

但作为一个还处在发展早期的领域,这些不同层面的能力很少在一个体系内能让人真正广泛地用起来。这无疑不利于整个行业内构建数据飞轮,实现技术落地。

而国内最早做物理世界模拟的群核科技率先做了一个决定:将 14 年来沉淀的底层空间能力汇聚在自己的 Aholo 空间智能开放平台,全面开放给行业。其中包括其模型层和工具层的空间重建、空间生成、空间编辑与空间理解在内的能力,将以 API/SDK 的形式逐步对外开放。

空间重建借助 3DGS 技术能够快速 1:1 复制物理世界到数字世界。空间生成则是从 0 到 1 创造 3D 空间,几句话描述或者给模型一张照片,模型就能生成三维场景。今年国内外空间生成模型动态频频,是空间智能领域 " 新王们 " 的一个核心押注方向。空间编辑解决了当下 AIGC 无法二次编辑调整的痛点,让 AI 生成的空间内容不再是 " 黑箱产物 "。空间理解则是包括具身智能等智能体看懂眼前物理世界的基本能力。

外界看来,这四重能力集中在一个平台,其实有助于加速行业推进空间智能的应用和落地进程,加速基于场景数据 - 应用反馈与迭代的闭环。

原来重建工作主要靠 CAD 图纸等去做一些数字化,真实世界数据与数字世界数据之间有 GAP。而 3DGS 技术和空间生成能力协同,相当于打开了内容的新的源头,打破了过往高质量 3D 数据的瓶颈。

" 源头打开了,才会有人把内容导入到工具平台,用户才会进来完成后面的编辑跟推理工作 ",一位行业资深人士指出。

空间编辑可以视作数据优化与交互界面。此前群核就已通过酷家乐等产品载体将之用在空间设计、电商 3DAI 设计、工业柔性制造等场景中。

现在进一步对外开放,随着更多数据导入,有了编辑工具就像语言模型的多轮对话能更好校准用户需求提升回答准确性一样,专业人士借助工具链去做更加深度编辑。比如把商品放入到构建好的数字空间里,设计师能自由编辑,产出更符合个性需求的高品质内容物料。

" 市场才刚刚开始,谈不上竞争。行业当下最需要的是底层技术的‘卖水人’,我们希望空间智能能够更快向前。" 群核科技董事长黄晓煌在媒体沟通环节告诉数智前线。

随着算力的提升,当下无论是空间设计、XR、影视短剧、文化遗产保护等 3D 内容创作领域,还是工业数字孪生、机器人仿真训练等对 3D 结构化数据有高要求的场景,对高质量、可交互、可计算的 3D 场景和数据的需求都在急剧攀升。

那些能够把物理世界和数字世界更好连接起来的技术能够开放出来,无疑对行业早期是一个巨大的驱动。

一家公司的飞轮和中国 AI 的飞轮

而对群核这家公司来说,随着越来越多用户使用,反馈沉淀,其自身的数据飞轮正在增强。

这家从空间设计软件起家的公司,现在已经是全球最大的空间设计平台。群核有着全球最多元庞大的空间场景沉淀,并且,由于空间设计最终都要真实落地,让其沉淀的数据具备了独特的物理正确属性,符合物理规律。在空间智能时代,这些都成为了构建强大空间智能模型的燃料。今年它也正式推出了业界首个专注于 3D 室内场景认知与生成的空间大模型。可以说,群核自身已经形成了一个正向循环的飞轮。

空间编辑工具带来了空间场景和数据的沉淀,海量的数据加速了空间大模型迭代。而随着此次更多的能力对外开放,群核完成了数据 - 大模型 - 工具能力的全链路开放,这家公司又有机会获得更丰富更开放多维的场景和数据沉淀,真正成为一个空间智能的基础设施平台。正向循环的数据飞轮有望更加速运转。

目前在一些场景里,群核已经与一些合作伙伴探索测试基于 Aholo 平台四项能力在同一个工作流去应用落地。比如工厂数字孪生和仿真场景,一些成熟的工厂需要引入智能化设备。基于群核这套能力去做模拟仿真,可以大大降低不合理设计带来的成本浪费。

另一方面,从数据到模型到底层能力的全面开放,对群核而言,也意味着从 3D 空间软件提供商走向了空间智能服务提供商。

黄晓煌提到,空间智能此前更多是群核内生的能力,之所以通过 Aholo 平台开放出来,是因为他们认知到时代在发生变化。能力开放后滚动而来的新的数据和能力进一步让群核的应用有了迭代。

他们刚刚发布的 3D AI 内容创作工具 LuxReal 就是一个代表。通过空间大模型和工具的相互补充,LuxReal 或许能够补足现有视频生成模型时空不一致和不可控的问题。这或许是全球第一个 3D 视频生成 Agent。

" 今年以来包括 Deepseek 在内的一批公司都一开始就把底层能力暴露出来,大家有一种一起推动行业往前走的势头,我们也顺势而为。" 他认为,空间智能正处于发展早期阶段,基于开放的平台,整个行业能一起解决问题,突破技术瓶颈。

外界观察来看,这可能也是当下新一批中国公司开放创新浪潮的一个缩影。中国创新企业正进入新的阶段,既能参与最前沿赛道最前沿战场的创新,也以开放和共享的姿态,有成为行业基础设施的能力和意愿。

这种角色变化里其实也能窥见中国企业在人工智能时代里的一种可能的成长路径。

以群核和快手这批企业为例,过往在应用时代,基于场景沉淀出数据,今天正在成为推进 AI 发展的重要燃料,它进一步带动了企业在新兴赛道智能飞轮的形成。可以说,应用优势,在全新的人工智能时代仍有回响。

中国整体在移动互联网时代强大的应用场景和海量数据积累,能否推动中国 AI 更快构建这种场景 - 数据和智能的飞轮,实现从场景到智能的跃迁?从这个意义上看,当下中国 AI 也需要加速构建这一轮智能飞轮。

© 本文为数智前线(szqx1991)原创内容

未经授权,禁止转载

进群、转载或商务合作联系后台

文章精选

双面美图:AI 复苏是虚火,还是实功?

央国企主导、金融与汽车冲锋,一张企业级智能体落地路线图正在成型

豆包手机:野心很大,阻力也很大

风口上的 AI 玩具,为何被从业者想简单了?

互联网 " 现金王 " 一夜易主,外卖千亿战事 " 换轨 "

10 万人用脚投票,为何是 Rokid 乐奇

独家|华为云组织调整,研发团队划归华为 ICT

华为 Mate80 全系降价背后

为何 B 站在 AI 上比快手字节慢半拍?

面对越来越强的模型和岗位消失,我们该做什么?

突破 AI 产业落地卡点,蚂蚁韦韬:数据是变革关键

500 万场会议、346% 营收增长,智慧办公撬动科大讯飞全球版图

联想开天工作站,站在巨人肩膀上的信创引领

自己家的双 11,钉钉 AI 表格杀疯了

AI 风险事件频发,全球风控出现大变局

全球行业领头羊,给中国 AI CRM 打了个样

眼镜巨头与科技新贵,在 " 密谋 " 一件大事

万亿低空经济,别光盯着载人飞行器

京东零售的 AI 野心:为每个商家打造自己的 "AI 战队 "

印刷 OLED 规模化量产在即,一场中国面板厂商的突围战

历史进程中的浙大

松下电视的结局,藏着日本家电的宿命

大模型五大 " 标王 " 与六边形战士

枪响在 2018:神秘东方力量,为何扎堆杭州

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 人工智能 快手 物理 奥特曼
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论