钛媒体 昨天
OpenAI预告了AI时代「Windows系统」的诞生
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 窄播,作者 | 李威

这是《窄播 Weekly》的第 68 期,本期我们关注的商业动态是:OpenAI 在今年的 DevDay 上更清晰地向我们展示了如何构建一个 AI 时代的超级系统。

上周用 Sora 2 引爆 AI 圈之后,本周 OpenAI 继续贡献了 AI 领域的两个热点话题。一个是在 DevDay 上公布的 Apps in ChatGPT 和 Agent Kit,让大家看到了 OpenAI 准备如何围绕 ChatGPT 的对话式交互,去构建一个 AI 时代的「Windows」系统。另一个则是 OpenAI 在算力采购领域的大手笔投资,有估算认为采购总额已经接近 1 万亿美元。

就像 OpenAI 的 CEO 山姆 · 奥特曼在一档播客节目中所说,ChatGPT 上线之后经历了两个关键的「惊喜」时刻,首先是用户增长和黏性都远超预期,其次则是科技巨头们没有及时跟进,给 ChatGPT 留出了建立竞争优势的空间。

也因此,在过去的两年多时间里,OpenAI 得以稳步推进自己的战略布局。

这个布局的全景就是要构建起三个相互依存的 AI 基础设施:第一,通过大规模投资算力基础设施,掌握足够充裕的算力资源,支撑大模型的进化和应用;第二,通过不断优化,建立性能强悍的大模型家族,在核心技术层面保持领先优势;第三,依托算力和模型基础,推动构建以 ChatGPT 为核心的 AI 应用生态。

相比 OpenAI 在算力层面的投资,我们会更关注 OpenAI 将如何围绕 ChatGPT 构建奥特曼口中的一个「真正强大的 AI 超级系统」。这是普通用户更有直观感知,并且更能够给到当下国内的 AI 产品启发的一个层面。

其中,刚刚推出的 Apps in ChatGPT 尤其值得关注。这个功能将 AI 助理与浏览器进行了更深层次融合,探索了传统 App 与 AI 助理的结合,让用户可以像在电脑上浏览网页一样,在 ChatGPT 的对话中去实时唤起不同 App。沿着这个路径发展下去,浏览器未来可能只会作为一个帮助 AI 助理处理复杂任务的操作台存在,其入口地位会被 AI 助理所承接。

这也可以说明,为什么奥特曼不愿用「超级 App」,而是选择「超级系统」来描绘 OpenAI 的发展前景。因为 OpenAI 不是要为 ChatGPT 集成不同的功能,而是想围绕对话式交互,打造完善的账号体系、开发生态和商业模式,让 App 和 Agent 们都跑在 OpenAI 为其提前铺设好的轨道上。

现在,OpenAI 在进一步探索,如何通过对话式的交互,实现服务与信息的获取与分发,真正扮演好入口的角色。

不成熟但有新意的 Apps Inside ChatGPT

在 OpenAI 发布的信息中, Booking.com、Canva、Coursera、Expedia、Figma、Spotify、Zillow 是首批参与 App Inside ChatGPT 的伙伴。并且,在今年晚些时候会公布开发者如何通过应用盈利的细节。

但当我打开 ChatGPT 体验 App Inside ChatGPT 功能时,发现这个功能目前只能完成一些简单和粗糙的操作,并没有如预想中那样可以支持更为复杂的操作。

参照 OpenAI 在发布会上的演示,我在 ChatGPT 的对话框中让 Booking 帮我找几家北京的、可以提供停车位的酒店。然后会弹出将 ChatGPT 与 Booking 进行连接的授权界面,点击确认后会显示正在调用 App。然后就可以在聊天界面内嵌的 Booking 窗口中,看到几家酒店的推荐,每个酒店下面都会有跳转到 Booking 的链接。

当我再继续要求 Booking 给我介绍一家酒店的详细信息时,ChatGPT 会显示目前不支持查看 App 内的酒店的详细信息,只能像之前一样整理成文字信息呈现在聊天界面中。这也就意味着,Booking 在 ChatGPT 内的嵌入,目前还只能给我们提供一个以网页形态呈现的搜索结果,和之前的列表方式没有本质区别。

然后我又尝试了唤起 Zillow 和 Spotify,前者的打开速度很慢,后者则没有成功唤起,依然是 ChatGPT 自己整理了一份文字歌单给我。

显然,OpenAI 还需要一个过程来打消 App 们的顾虑,建立起一个共赢的生态,进而在 ChatGPT 内提供更丰富、深度的 App 能力。

奥特曼提到,OpenAI 本来可以设计出更流畅的使用体验,但这会对合作伙伴极为不利,所以他们选择将用户引导进原生 App 中。

「用户明确指定要使用某类服务时,我们会主动推荐合作方;合作方接管交互界面并关联用户账户,确保用户能与原服务保持直接、透明的连接。这种方式或许在用户体验的流畅度上略有妥协,但从长远来看,更有利于整个行业的健康发展。」奥特曼表示。

重新理解 AI 助理

在 OpenAI 目前选择的这条路径下,作为 AI 助理的 ChatGPT,扮演了最核心的角色。

所有的交互方式、开发工具和商业生态都是围绕这个核心来构建的。其中,对话是最主要的交互方式,未来点击、滑动可能只会作为辅助操作存在;开发工具则主要服务于应用生态的搭建;商业生态是开放的,可能会出现更多基于效果的分成机制。

这样的一个系统下,我们对于 AI 助理的理解会变得更为清晰。

第一,AI 助理就是要扮演管家的角色,负责统筹这个家庭中的不同工作人员,为主人提供服务。用奥特曼的话说就是,AI 助理的目标是提供单一且高效的 AI 服务,贯穿于用户的「整个生活轨迹并持续输出价值」。

这样的 AI 助理就需要横跨不同硬件端,有自主可控的模型能力,有长久记忆能力,以及拥有庞大用户体量。ChatGPT 的全球周活跃用户数已经达到了 8 亿,规模入口能吸引更多产品和应用嵌入到 ChatGPT 当中。

第二,AI 助理与浏览器的「主次关系」会变得更为明确。作为入口的 AI 助理会获得更大的主动性,浏览器则作为人与 AI 共用的操作台存在。Booking 目前在聊天框内嵌入的就是一个网页,那未来可能会在聊天框内唤起更复杂的网页,让人和 AI 助理能够基于网页呈现进行更效率更高的对话。

长期来看,Apps Inside ChatGPT 不能做到的复杂交互很可能会以 Agent 的形式在 ChatGPT 内实现。从 App 到 Agent 的发展,会很像微信小程序的发展过程,一开始垂类 App 只是将小程序作为功能简单的引流工具使用,但越往后小程序的功能就越与原生 App 相近。

OpenAI 推出的 AgentKit 能够支持用户可视化、零代码创建专业 AI 工具。而 Agent 搭建门槛的降低会加快 App 转化成为 Agent 的过程。未来人们最主要的交互可能就是和 Agent 的对话。这时的浏览器可能会从操作台演化为一个随时可以被唤起的看板,能够实时展示不同任务的执行情况。

第三,AI 助理就是一个账号体系。像 ChatGPT 这样的 AI 助理,会成为最懂用户喜好、掌握用户最多隐私信息的账号。奥特曼认为,AI 助理未来可以智能判断用户的哪些信息可共享、哪些信息需予以保护,配合不同 App 和 Agent,为用户提供更具连续性和个性化的体验。

并且,奥特曼还认为,C 端和 B 端对 AI 的应用,会比外界预期的更快走向融合,最终用户将拥有一款能覆盖所有场景的通用 AI 工具。这个工具事实上就是 OpenAI 要建设的超级系统。在这个系统中,作为账号的 ChatGPT 能够及时适配工作场景与生活场景不同权限、能力要求的切换,并调用不同的能力完成任务。

如果参照奥特曼的构想来衡量国内的头部 AI 企业,会发现字节的豆包更明显地在构建一个完善的 AI 系统能力,阿里、百度、腾讯则都还处于四处出击的阶段,没有在 AI 助理和浏览器之间形成合力,也没有积极地围绕 AI 助理进行 Agent 生态建设,以及探索 App 与 AI 助理的融合。

但腾讯还存在微信这个变量。微信本身就具备了庞大的用户体量、小程序生态和商业能力,并且在手机端和 PC 端也实现了打通,其搜索框也在向 AI 搜索框进化。只是,目前微信中缺少了一个 AI 助理。一旦微信的 AI 助理上线,将会轻易改变 AI 助理的现有竞争格局。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

奥特曼 windows ai时代 基础设施 科技巨头
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论