产业家 前天
从AI技术到AI落地,Google I/O开发者大会传递出了7个信号
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

产业互联网第一媒体。产业家

正如谷歌CEO皮查伊所言:"我们正进入AI平台变革的新阶段。"这场发布会不仅是一次技术秀,更是一场关于未来十年产业变革的宣言——AI的战场,正在从代码与算力,转向千行百业的真实场景。

作者|斗斗

编辑|皮爷

出品|产业家

在一片期待与好奇的氛围中,谷歌I/O开发者大会如期而至,5月21日凌晨1点,于美国加州山景城的海岸线圆形剧场内正式拉开帷幕。

不出意外的,AI依旧是今年的主题,但不同于以往,今年谷歌I/O开发者大会的热度高的出奇,网友的口碑也是一片叫好。

在全球科技圈的集体注视下,这次谷歌究竟到底带来了哪些技术升级和新产品?对于AI技术落地企业、行业甚至产业的方向,以及AI技术的走向,又传递了哪些讯号?

模型——从秀能力奔向秀落地范式

Gemini 2.5 Pro模型,是这次大会的重头戏。

与前代模型相比,Gemini 2.5 Pro最大的突破在于引入了"动态推理架构"。它不再是单纯根据输入数据生成答案,而是通过生成多个假设分支、模拟不同决策路径,最终选择最优解。这一机制类似于人类在复杂问题前的"沙盘推演",使AI在医疗诊断、工业质检等高风险场景中的错误率降低。

技术突破的落地往往受制于现实瓶颈。

以往,制造企业长期抱怨AI模型的"黑箱特性",例如即使模型给出错误判断,工程师也难以追溯问题根源。为此,Gemini 2.5 Pro的"推理过程可视化"功能,将模型决策拆解为可解释的逻辑节点,例如在汽车焊点质检中,系统不仅能识别缺陷位置,还会标注"因焊接温度波动超过阈值导致金属结晶率下降"等具体原因。

2025年,全球AI产业站在了十字路口。当生成式AI在内容创作领域陷入同质化竞争时,企业对AI的期待已不再局限于"回答问题",而是希望其成为驱动决策的"智慧大脑"。谷歌此时推出Gemini 2.5 Pro,正是回应了这一产业转型的迫切需求。

可以预见,在这一技术升级下,未来具备"决策可追溯性"的AI模型将渗透企业核心业务流程,推动AI从效率工具升级为战略决策中枢。

在模型方面,谷歌还发布了Deep Think超强版以及Flash低门槛版。

Deep Think版本通过引入增强型推理机制,在数学、编程和多模态任务中实现"可能性预判",显著提升复杂场景的决策精度,其在目前最难的数学基准之一 2025 USAMO 上取得了令人印象深刻的分数。此外,还在一个针对竞赛级编程的难度基准—— LiveCodeBench 上处于领先地位,并在测试多模态推理的 MMMU 上取得了 84.0% 的分数。

其Flash版本则专为速度和低成本而设计,以轻量化设计支持边缘计算。数据显示,该模型响应速度较之前提升40%。

谷歌这种模型分层设计(云端大模型+边缘轻量化),可以大幅解决产业落地中"算力-成本-实时性"的三角矛盾。

总结来说,此次Google I/O开发者大会,谷歌在模型层面不仅仅是秀能力,更多的是通过新产品和技术升级,推动AI真正落地场景、行业、产业,秀的是其AI技术落地路径。

AI问答助手:

可听、可看、可操作

除了大模型方面的升级,谷歌还发布了一系列产品,其中Project Astra 所展示出来的多模态交互能力,让人眼前一亮。

其技术突破在于多模态感知的深度融合:摄像头捕捉视觉信息后,系统会结合麦克风阵列的空间音频定位、IMU传感器的运动轨迹数据,在0.1秒内构建出完整的环境模型。

众所周知,AI辅助设备的核心痛点是现有系统依赖语音指令或固定阈值报警,却无法像人类一样感知环境动态。

谷歌Project Astra 的发布,标志着AI开始具备"具身认知"能力——它不仅能"看"和"听",还能理解物理空间的上下文关系,并主动采取行动。

但实现这一能力需要突破硬件算力的物理限制。传统边缘设备难以支撑实时视频分析所需的算力,而Project Astra通过"动态任务卸载"技术巧妙化解了这一矛盾:低复杂度任务(如手势识别)在本地完成,高负载任务(如3D环境建模)则通过5G网络回传云端处理。

现在,Gemini Live 已整合 Project Astra 的摄像头和屏幕共享功能,并向所有 Android 用户开放,并将于当天开始向 iOS 用户推出。

从更大的视角来看,该产品或将很大程度上,改变AI助手抑或是智能终端在场景割裂(如家庭与办公场景需切换不同设备)和被动响应(仅回答预设问题)的局限,满足企业级连续性需求。

AI搜索,

一个能完成各种任务的智能助手

此次大会上,谷歌还首次将 Gemini 2.5 Pro 深度整合至搜索引擎,推出"AI 模式"功能。

据了解,用户可通过多模态输入(文字、语音、图像)直接获取结构化答案,而非传统链接列表。

以规划 "东京五日游" 为例,AI 不仅生成详细的行程建议,还会根据用户的预算、喜好、出行方式等个性化需求,自动推荐合适的餐厅、酒店,并提供在线预订服务,同时还能比价购票,为用户节省时间和成本。在旅游过程中,用户甚至可以通过摄像头实时识别景点,获取详细的背景信息和历史故事,让旅行体验更加丰富和有趣。

这标志着搜索引擎或将从传统的链接列表模式向智能化、个性化、服务化的方向全面转型。

这与传统广告模式的底层逻辑完全不同。

在过去,广告商主要通过购买关键词广告、展示广告等方式吸引用户点击链接,进而实现品牌推广和产品销售。然而,AI 模式通过直接在搜索结果中嵌入商品推荐和 "智能结账" 功能,为电商、本地服务等行业开辟了全新的变现路径。

此外,AI 直接提供答案的模式将减少用户跳转第三方网站的需求。这一变化对内容生产者提出了新的要求,倒逼他们优化数据结构以适应 AI 抓取,推动 SEO(搜索引擎优化)向 "答案优化" 转型。内容生产者需要更加注重内容的质量、深度和结构化,以确保其信息能够被 AI 准确理解和呈现,从而在新的搜索生态中占据有利地位。

据谷歌透露,其搜索业务的 "下一站" 将是 AI 驱动的交互模式升级,用户将体验到更加自然、个性化的信息获取方式,从而重构互联网流量分配规则。

未来,搜索引擎或将不再是简单的信息检索工具,而是一个能够理解用户意图、提供主动服务、协助用户完成各种任务的智能助手。这将彻底改变用户与互联网互动的方式,推动互联网行业进入一个全新的发展阶段,为相关产业带来新的机遇和挑战。

AI Agent——从"工具"到"同事"

Project Mariner 代理系统的升级也是本次大会的一大亮点。

升级后的 Project Mariner 代理系统可同时处理 10 项任务,例如在用户指令下自动完成 "查找食谱 → 生成购物清单 → 在线下单" 的全流程。其基于浏览器扩展的架构,能理解网页内容(文本、图像、表单)并模拟人类操作。

对于企业而言,Project Mariner 在重复性流程的自动化处理方面展现出了巨大的价值。

在数据录入工作中,它能够快速准确地将大量数据录入系统,避免了人工操作可能出现的错误和疲劳,提高了数据处理的速度和质量。在订单处理方面,它可以自动跟踪订单状态、更新订单信息、安排发货等,确保订单的及时交付和客户满意度的提升,帮助企业节省运营成本。

目前,谷歌方面表示Project Mariner 的技术将通过 Gemini API 开放给开发者,而这一举措也将进一步扩大了其生态影响力。

开发者可以基于 Mariner 的功能开发出更多符合特定行业和业务需求的应用程序,为企业提供个性化的自动化解决方案。例如,在金融行业,开发者可以利用 Mariner 的多任务处理能力和网页理解能力,开发出自动化的风险管理工具和投资分析平台,帮助金融机构更高效地进行市场分析、风险评估和投资决策。

这一变革不仅提升了生产力效率,也为 AI 代理的商业化应用提供了新路径。

随着 Mariner 技术的不断成熟和应用场景的不断拓展,它将为企业和用户带来更多创新性的解决方案,推动各行业向智能化、自动化方向加速发展,进一步重塑产业格局和工作模式。

生成式AI,奔向工业化生产

在内容创作领域,谷歌也带来了一些重大突破,推出了Veo 3视频生成模型和Imagen 4图像生成模型。

据了解,Veo 3支持音视频同步生成,例如为视频添加背景音乐、音效甚至对白,解决了以往AI视频生成中"有影无声"的问题。

提示语:90 年代酒吧里的情景喜剧场景,背景墙上的霓虹灯写着 "fofr"。一对夫妇说了些什么,观众大笑起来。

而Imagen 4的图像生成速度比前代快10倍,分辨率达2K,细节渲染能力显著提升。

目前,两者均被整合至电影制作工具Flow中,支持自定义镜头、场景和角色动作。

开发者大会上,谷歌展示了Veo 3生成的高清视频,其细节渲染能力接近专业电影制作水平。可以期待的是,在短视频和广告行业,创作者未来或将可通过AI快速生成高质量素材,制作成本或将大幅降低。

更值得期待的是,在影视工业领域,Flow工具允许导演用自然语言调整镜头语言,AI实时渲染预览画面,缩短制作周期,这将推动"敏捷创作"模式普及。

总得来看,Veo 3和Imagen 4的推出,显然直接降低了内容生产的门槛。

针对当下生成式AI的广泛应用带来的版权和伦理挑战,谷歌还同步推出的SynthID水印技术,试图通过技术手段解决AI生成内容的真实性验证问题。

这一技术不仅重塑了内容生产范式,也为长尾创作者提供了与大厂竞争的工具,推动创意产业进入"人人皆可创作"的新阶段。  谷歌透露,未来还将推出"AI导演"功能,通过强化学习自动生成完整影片叙事框架。

可以看到的趋势是,AIGC(人工智能生成内容)正从"创意辅助"转向"工业化生产"。

AI时代的"Android生态"逐渐完整

在硬件领域,谷歌联合XREAL发布的Project Aura AR眼镜,是本次大会的一大亮点。

据了解,该眼镜搭载高通XR芯片和Gemini助手,支持实时导航、多语言翻译、语音拍照等功能。其基于Android XR平台,可接入谷歌应用生态。

值得注意的是,在这个过程中,谷歌可通过开放Android XR SDK,吸引开发者构建应用,与苹果Vision Pro、Meta雷朋眼镜形成"平台+硬件+内容"的全方位对抗。

此外,谷歌还宣布Gemini将全面融入安卓生态,覆盖手机、智能手表、汽车仪表盘及电视等终端。用户可通过电源键快速唤醒手机端的Gemini,而车载系统Android Auto、智能手表Wear OS及Google TV均已深度集成Gemini模型,支持自然语言交互与多任务处理。

Gemini深度集成至安卓电源键、汽车仪表盘等核心交互入口,本质上是将用户流量从第三方应用(如Spotify、Uber)向谷歌自有服务(如Google Maps、YouTube)导流。

在降低开发门的API与工具链(如Live API、Agent模式)下,开发者一旦接入谷歌生态,其数据存储、模型调用均依赖谷歌云服务,将形成"开发-部署-运营"的全链条依赖。

通过这种"全家桶式"整合,其实是谷歌在为自己成为AI时代的"水电煤供应商"铺路。这张从硬件到软件的生态大网,编织的愈发完整。

订阅制商业模式,奔向盈利 

除了产品的技术,在商业模式上的变化,也是谷歌在 AI 商业化道路上的一次重要尝试。

具体来看,谷歌推出了每月 249.99 美元的 AI Ultra 订阅计划,为追求极致体验的用户提供最高权限的模型访问(如Veo 3、Deep Think模式)、30TB云存储及优先体验权。

这一动作背后,其实是谷歌通过这一模式,瞄准企业用户和专业开发者,构建"软硬一体"的利润池。

例如,开发者可通过订阅服务访问Gemini 2.5 Pro的深度推理能力,而企业用户则能利用AI Ultra的生成工具提升内容创作效率。

AI Ultra的推出标志着AI服务从"功能采购"转向"能力订阅",推动行业向云计算模式靠拢。谷歌的订阅制策略与OpenAI(200美元/月)和Anthropic(200美元/月)形成竞争,但其通过全家桶生态(搜索、Workspace、Android)形成差异化优势。

例如,AI Ultra用户可享受YouTube Premium服务、Google Drive的30TB存储空间,以及由Project Mariner技术支持的代理工具。

这一模式不仅提升了谷歌的盈利能力,也为AI技术的商业化落地提供了新路径。

写在最后:

2025年Google I/O开发者大会揭示了AI技术从实验室走向产业落地的三大核心趋势:

一是从"通用"到"垂直",Gemini 2.5 Pro的深度推理、Mariner的流程自动化等功能,证明AI技术正逐渐具备解决行业具体痛点的能力。;二是从"替代"到"增强",AI不再简单替代人力,而是通过AR眼镜、实时搜索等工具扩展人类感知与决策能力;三是从"实验"到"规模",订阅制、开发者工具链和硬件生态的完善,标志着AI技术在规模化商用这条路上又迈进了一步。  

最新视频号内容推荐

产业AI大模型

《财务大模型,产业路向何方?》

《沸腾的大模型:谁在成为主角?》

《大模型落地金融业,想象力在哪?|产业特稿》

《重新理解百度智能云:写在大模型开放后的24小时》

《一所南方学校,遇上AI的60天》

《金蝶,「起舞」在大模型时代》

产业数字化

数字化大势下,科创板IPO的"紧箍咒"

透视京东,和隐藏起来的200个上升密码

云上管车背后:透视数字化时代的企业内功

透视云测试:技术、产业、降本增效下的数字化之战

产业SaaS

《2021年SaaS行业八大趋势|盘点》

美团阿里鏖战,餐饮 SaaS无「终局」

产业供应链

产业互联网时代,谁在重写供应链?

牵手国资背后,再看苏宁的零售产业边界

产业硬科技

《云从「敲门」科创板》

《物联网,一场上云的巨型战役》

《华为:用鸿蒙HarmonyOS2.0讲的新故事》

《国产芯片战场:掣肘、决心和看得见的未来十年》

© 往期回顾

产业家网全新上线

© THE END

本文由产业家原创出品,未经许可,请勿转载。

/

欢迎爆料

产业家报道联系微信号:15201450756

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 谷歌 deep 开发者大会 数学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论