在 4 月 25 日的百度 Create 大会现场,百度创始人李彦宏带来百度文库、百度网盘联合推出的全球首个内容领域操作系统——沧舟 OS。
依托沧舟 OS,百度网盘和百度文库联合推出 "AI 笔记 ",用户在网盘内观看学习视频时,可一键生成 AI 笔记,还能生成 AI 思维导图、基于视频内容 AI 出题,实现视频和笔记在同界面的流畅联动。
百度创始人李彦宏曾将百度文库称为 " 百度 AI 重构最彻底的一款产品 "。百度副总裁,文库事业部、网盘事业部负责人王颖在接受包括《每日经济新闻》记者在内的媒体采访时指出,整个行业的发展趋势都是通过能力的组合与对 Agent 的调用,逐步实现对用户完整需求的交付。
MCP(Model Context Protocol,模型上下文协议)是 AI 领域最新热议的焦点,值得注意的是,不久前的 4 月 15 日,支付宝联合魔搭社区,在国内推出 " 支付 MCP Server" 服务。王颖认为,作为一种协议,MCP 已经初步具备了承载体系化协同的基础条件。
AI 的未来:无所不能、无处不在
" ‘无所不能、无处不在’是我们希望 AI 未来能达成的愿景和目标," 百度副总裁,文库事业部、网盘事业部负责人王颖在采访中表示,好的 AI 应该像人一样思考,像人一样工作。
基于这种愿景,百度文库和网盘联合推出了 " 沧舟 OS" 操作系统,构建了以多 Agent 智能体协同为核心的平台,希望在文库、网盘等产品之上,融合输入、处理与输出三大能力,以期在任何场景下都能为用户提供端到端的深度交付。
在百度内部,构建这样一套系统并非一蹴而就。王颖坦言,之所以没有早点推出,是因为它需要长时间的能力沉淀——从文库、网盘的 AI 重构开始,百度文库、网盘就在系统性地积累大模型赋能下的多模态输入、输出、信息处理等能力,并通过 Agent 协作机制将这些能力整合成能够深度交付的工作流。这源于技术能力的长期积累,也是在行业演进中不断适配、串联能力的结果。
基于此,王颖介绍," 沧舟 OS" 系统的构建除了在横向上围绕输入、处理、输出建立工作流,同时在纵向架构上也遵循了 MCP Server(模型上下文协议服务器)、MCP Client(应用服务层)、MCP Host(面向用户的终端层)三层结构。
其中,MCP Server 包括底座基建和中枢系统:底层基建包含工具框架和知识化框架,沉淀了丰富的公域知识库、私域知识库,以及用户记忆库 " 三大库 " 和用于调用的工具能力;中枢系统包括融合编辑器、阅读器、播放器 " 三大器 ",以及调度中枢,结合用户记忆和画像数据,通过模型理解用户意图,高效分配调度 Agent。MCP Client 是应用服务层,聚合了文库、网盘等自研 Agent 以及专业的第三方 Agent,构成核心中枢。MCP Host 则是面向用户的终端层,涵盖企业用户、开发者、智能体应用等各场景和终端。
王颖表示,从早期的 Chatbot(聊天机器人),到后来的 Agent(智能体),再到多智能体协同,以及当前广受关注的 MCP 概念,整个行业的发展趋势都是通过能力的组合与对 Agent 的调用,逐步实现对用户完整需求的深度交付。王颖认为,作为一种协议,MCP 已经初步具备了承载这一体系化协同的基础条件。
面对 " 沧舟 OS" 系统落地过程中的技术难题,王颖坦言:" 几乎每一步都是挑战。"
王颖指出,首先是多模态内容的理解层面,包括模型如何应用、文件怎么解析、解析后如何变成同样的向量,以完成进一步的推理,这是工程团队和大模型团队从去年就开始做,直到没有问题才集成到系统上的。
其次是用户意图的理解与澄清,王颖认为,这是降低用户操作门槛的关键。
此外,王颖还提到多模态的输入和输出," 我们希望多模态是一个完整的交付,从输入开始就应该是多模态,拍照、语音、文字都可以作为任务起点 "。
为了实现规模化应用与商业可持续,王颖强调控制成本与提升调用效率的重要性。" 现在爆火的智能体都是不可持续的,每个人都要搞一遍,它的成本是很难控制的。" 王颖认为,通过多任务智能体调用的方式,能够把每一次调用的成本摊薄,才有机会让 AI 实现真正可用、可规模化使用。
从深度思考,到深度交付
" 这套系统应该长成什么样子?应该根据用户的需求来看。" 当被问及如何理解沧舟 OS 系统时,王颖表示。
在王颖看来,大模型时代的操作系统将与传统 PC 时代完全不同。从 PC 时代的 Windows 系统到今天的 AI 原生平台,最大的区别在于是否能够端到端地解决问题。
过去,Windows 以窗口式界面为统一形态,基于 Windows 之上的各种应用程序完全不同。" 因为它受限于技术不能够端到端解决问题,所以导致底座是底座,通用程序是通用程序。" 王颖表示。
在大模型驱动下,情况发生了变化,王颖认为,大模型时代的操作系统最后要解决端到端的问题。AI 不再只是工具,而成为 " 任务解决者 "。王颖认为,真正的 AI 操作系统,最终目标是实现从需求理解到任务完成的全链路闭环,端到端地实现从深度思考到深度交付。
" 沧是沧海的意思。我们的系统就像水一样,放在圆的容器里就是圆的,放在方的容器里就是方的。" 也正因如此,沧舟 OS 的具体形态因任务而异:在自由创作场景中,它表现为 " 自由画布 ";在学习场景中,在网盘里可以呈现为 "AI 学习笔记 ";在视频场景中,系统又会自动唤起视频理解、知识提炼等多模态能力。
王颖表示,当前,行业的共识是:靠单个 Agent 解决不了复杂问题,必须靠多 Agent 协同。王颖指出,如何搭建一套好的工作流,然后解决完整的任务,是大家都去追求的目标。
王颖强调,不可能有一个通用的 WorkFlow(工作流)能解决所有问题,而是应该随着用户的操作路径,实时构建出最合适的流程。在沧舟 OS 中,这样的 " 流程生成 " 也是由系统自动完成的。" 你觉得下一步是什么,我给你的就是什么 ",这是沧舟 OS 区别于传统操作系统的根本所在。
" 从第一天开始希望我们解决问题的能力是,让 AI 聪明又能干。" 王颖表示,生成只是第一步,生成完了能够真正可用,才是最重要的。
因此,在当前阶段,王颖强调的是更实用的工程路线:以多模型组合、多 Agent 协同,再加上完整的产品工程体系,分阶段推进 AI 的落地能力。
" 以前连这个都不具备,因为以前的大模型没有这种通用的能力,都是专用的能力,是解决不了的。" 王颖表示,通过深度思考、深度交付、公私域知识库和 MCP 体系,四者协同发力,才能在多元场景中真正满足用户需求。
每日经济新闻
登录后才可以发布评论哦
打开小程序可以发布评论哦