导语:当地时间 1 月 28 日,Google 宣布更新 Chrome 浏览器,将 Gemini3 全面接入桌面端 Chrome。
当地时间 1 月 28 日,Google宣布更新 Chrome 浏览器,将 Gemini3 全面接入桌面端 Chrome。此次更新实现深度集成,Gemini3 以常驻侧边栏形式待命,支持自动浏览、多模态交互等核心功能,可完成比价、行程规划、填表等复杂多步任务,联动 Gmail、地图等谷歌全家桶提升效率。同时 Google 还将 AI 图像编辑工具 Nano Banana 直接整合到 Chrome 中,实现了网页内的实时修图。
当全球最大浏览器装上 AI 大脑
此次 Chrome 与 Gemini3 的融合不只是在浏览器中简单叠加大模型能力,其特色更体现在它的实操能力和技术落地。
自动浏览是核心亮点,用户授权后浏览器可自主完成酒店机票比价、表单填写、报税文件收集等多步任务,甚至调用密码管理器处理需登录的操作,替代以往多标签页手动切换的繁琐流程。同时联动谷歌全家桶实现跨应用任务协同,不过该自动浏览功能仅面向 Google AI Pro 和 Ultra 订阅美国用户。
技术层面上,此次融合实现端侧部署 Gemini Nano 模型,让网页总结、基础交互等任务无需云端传输,兼顾响应速度与隐私保护,敏感操作前还会主动弹窗确认。此外,Nano Banana 支持网页内实时修图,无需切换专业软件,用户只需要在网页上选中图片输入提示词,就能完成对这张图片的修改。
浏览器的 AI 化改造还是 AI Agent
在此次 Chrome 与 Gemini3 的融合之前,已经有不少公司在 AI 浏览器这个方向进行探索。纵观当前市场上的 AI 浏览器产品,可以归纳为三种主要的发展路线。
传统浏览器的 AI 化改造是最主流的做法,策略是在现有浏览器基础上叠加 AI 功能,不改变产品的基本形态就能用。Chrome 将 Gemini 嵌入底层实现端侧 AI;Edge 通过 Copilot 实现系统级联动,主动预测用户需求;Opera 采取开放策略,其 AI 助手 Aria 支持接入多个大模型,让用户自主选择服务商;Brave 则将隐私保护作为核心卖点,主打本地处理与零日志记录。这条路线的优势在于用户迁移成本极低,但受限于既有架构,AI 能力往往以辅助插件的形式存在,难以突破原有交互逻辑。
原生 AI 路线则主打 AI Agent 智能代理能力。OpenAI 的 Atlas、Perplexity 的 Comet 以及 The Browser Company 的 Dia 都是这条路上的代表。它们从设计之初就以 AI Agent 为核心,采用 " 对话即界面 " 的设计理念:地址栏被智能指令框取代,标签页管理让位于任务流编排,浏览器记忆用户的偏好与上下文,能够跨网站执行复杂任务。例如 Atlas 的 Agent 模式可直接操作网页完成研究或购物,Comet 则在学术场景下自动生成引用文献与反驳观点。尽管当前任务成功率与稳定性仍有提升空间,但这种代理式交互代表了行业远期方向。
生态融合路线是国内厂商偏爱的策略。字节跳动的豆包浏览器是其 AI 助手 " 豆包 " 在 PC 端的承载形式之一,它深度集成了文生图、文生视频等 AIGC 功能,并与字节的办公生态飞书文档等联动;QQ 浏览器则与腾讯生态打通,可以直接调用微信读书、腾讯文档等服务中的内容;夸克则依托阿里通义千问打造贴合自身场景的 AI 任务助手,其生态优势还体现在背后的夸克网盘和夸克扫描王。这条路上的厂商不满足于 AI 浏览器的工具属性,谋求成为超级入口,好处是能够充分利用母公司已有的用户基础和内容资源,坏处是产品和服务可能会比较封闭。
AI 浏览器的未来在哪里
AI 浏览器仍处早期阶段,功能与体验均有待完善。但从趋势看,以下几个方向较为明确。
端侧 AI 会变得越来越强。现在很多 AI 任务还得靠云端服务器支持,但随着小模型技术进步和硬件加速能力提升,更多功能会在用户设备本地完成,这意味着更快的响应速度、更好的隐私保护以及离线使用的可能。Google 将 Gemini 嵌进 Chrome 就是这个方向上的重要一步。
Web Agent 会成为浏览器的标准配置。现在 Agent 功能还只有少数产品才有,而且经常不太稳定。但这个技术方向是明确的——用户用自然语言描述需求,AI 自动分解任务、操作网页、返回结果。预计未来几年,大多数主流浏览器都会具备类似能力,而且会越来越好用。
浏览器和操作系统之间的界限将持续模糊。随着 Web 应用能力越来越强,很多事情在浏览器里就能完成,不需要再安装原生程序。AI 浏览器会成为很多人主要的计算入口,就像当年浏览器取代了很多桌面软件的功能一样。这个趋势对所有浏览器厂商都是机会,就看谁能抓住。
在这过程中,AI 浏览器的发展必然要面对信任与控制的深层张力。核心矛盾在于:AI 的高效运转依赖对用户行为数据的深度解析,但这种解析本身又侵蚀着数字隐私的边界;当 Agent 代为执行金融交易、医疗咨询等高风险操作时,算法偏误或幻觉导致的错误成本将由谁承担,目前既无行业共识,更缺法律界定。监管框架的滞后性意味着技术迭代将在相当长的时期内运行在灰色地带,而用户对 AI 决策的过度依赖,可能催生新型的人机关系失衡。这些问题不解决,技术红利将难以转化为可持续的商业模式。未来,谁能在技术创新、隐私保护与生态适配之间找到最优解,谁就能在浏览器智能化的竞争中站稳脚跟、抢占先机。
(文章为作者独立观点,不代表艾瑞网立场)


登录后才可以发布评论哦
打开小程序可以发布评论哦