" 亚马逊云科技不会打极致的‘价格战’,我们更注重功能、安全、可扩展性、合规这些方面形成整体价值。我认为这些都是客户在将生成式 AI 推向生产阶段时必须要综合考虑的因素。" 近日(6 月 20 日),亚马逊云科技大中华区产品部总经理陈晓建在接受《每日经济新闻》记者专访时如是说道。
图片来源:企业供图
虽然当前 AI(人工智能)大模型行业还处在非常早期的阶段,但价格战已经愈发激烈。今年 5 月以来,头部厂商相继祭出 " 降价牌 ",阿里云宣布通义千问主力模型 Qwen-Long API(应用程序编程接口)输入价格直降 97%;百度也于近日宣布两款主力模型 ENIRE Speed、ENIRE Lite 全面免费。
Deepseek 所彰显的极致性价比能力仍在影响着中外的大模型厂商,在 " 价格战 " 下,行业洗牌速度加快,一些企业也在环境倒逼之下卷入这场漩涡之中。亚马逊云科技又如何看待这一趋势?
陈晓建对此显得相对坦诚而冷静:" 对用户来说,他们当然希望能用到最先进的功能,同时也希望价格合理,这都是完全可以理解的。但从另一个角度来说,虽然功能和价格是很重要的两个方面,但其实客户在使用生成式 AI 时还需要考虑很多其他的因素,比如安全与合规。我相信这也是所有客户都会非常关注的点。"
价格战之外,当安全合规成为核心壁垒
在陈晓建看来,亚马逊云科技在设计产品的时候,并不仅仅关注功能和价格,而是全面考虑整个使用过程中的关键因素,包括功能、性能、成本控制、数据结合能力、安全与合规等方面。这些都是亚马逊云科技持续重点投入的方向。
" 客户在落地生成式 AI 时,普遍会经历从业务场景选择、原型验证到最终上线的过程,期间主要面临模型功能匹配、成本控制、数据利用和安全合规四大挑战。" 陈晓建在采访中指出,不同大模型在具体业务场景中的表现存在差异,企业需在功能、性能与成本间做权衡," 比如选择最智能的模型、响应最快的模型,还是成本最低的模型 "。
此外,成本控制也是企业落地的核心考量之一。" 标准大模型调用中,部分成本来自冗余 token(语言生成模型在运作时的最小工作单元)消耗,而按 API 调用按需计费的模式已成为行业主流。"
陈晓建提到,Amazon Bedrock 提供的 Prompt Caching(提示词缓存)技术可减少 token 用量," 某电商客户通过缓存高频促销话术,降低了模型调用成本 "。对于定制化需求,平台支持模型微调与知识库构建," 若需要完全自定义训练,亚马逊云科技自研的专用芯片 Amazon Trainium 和 Amazon Inferentia 也可以提供支持 "。
在数据利用层面,企业同样希望挖掘自有数据的差异化价值。" 制造业的设备传感器数据、医疗行业的电子病历等非结构化数据,需通过清洗与语义建模才能被大模型理解。" 陈晓建介绍,Amazon SageMaker Unified Studio 整合了 PB 级(更高级别的数据存储容量单位)数据处理与大模型融合能力," 某车企通过该平台整合路采数据与仿真场景,缩短了高级辅助驾驶模型迭代周期 "。
最后一个挑战是安全与合规。每位客户都会将安全合规视为业务底线。无论客户在哪个国家或行业开展业务,都必须满足当地法律法规的要求,同时确保模型输出内容的合法性和可控性。" 金融领域的反洗钱模型、医疗领域的病历生成等场景,对内容合规性要求极高。" 陈晓建举例。
AI Agent 爆发前夜:从工具集成到智能决策的范式迁移
AI Agent(代理式人工智能)也被亚马逊云科技视为未来生成式 AI 发展的重要方向。
" 过去一年,机器智能已经爆发了,如今 AI 的发展又来到了一个拐点,我们正处在 AI Agentic 爆发的前夜。"6 月 19 日,在亚马逊云科技中国峰会上,亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松表示。
储瑞松指出,正如历史上蒸汽机的出现放大和解放了人与动物的肌肉力量,通过在纺织、交通、采矿和冶炼等领域的应用带来了工业革命。机器智能的爆发则放大和解放了人的大脑智力,其应用也将带来 AI Agentic 的革命。
从背后原因来分析,当前大模型虽为智能核心,但要解决现实业务问题,需借助 AI Agent 连接大模型能力与实际业务系统。它可对接企业内部 IT 系统,自动开工单、处理流程,完成一系列业务逻辑操作,是实现大模型 " 落地 " 的关键。
陈晓建表示,近期 AI Agent 的火爆,核心原因在于其开始具备 " 自主思考 " 能力,能拆解复杂问题,通过探索、推理解决问题。像 Manus 这类具备自我思考能力的产品备受关注,众多同类产品也朝此方向发展,"AI Agent 不再只是执行工具,更是智能决策中介。"
作为云服务商,亚马逊云科技又将如何抓住这一风口?
陈晓建表示,亚马逊云科技推出的 Strands Agents 工具大幅简化了开发流程。此前,合作伙伴完成典型业务场景可能需编写 2000 多行代码,借助 Strands Agents,仅需二十几行即可实现,底层逻辑通过 Agent 与大模型交互自动完成,开发者得以摆脱繁琐细节,专注业务创新。
类似这种开发效率的显著提升,预示着 AI Agent 将在更多场景落地,为企业智能化转型注入强大动力。
事实上,当前国内 AI 大模型行业竞争分化已然显现。李开复预测中国市场最终或仅剩 DeepSeek、阿里巴巴、字节跳动三家主导,其他厂商也纷纷在垂直领域进行深耕," 要么成为某行业的‘ AI 基础设施’,要么融入大厂生态。"
当前月之暗面的代码模型、MiniMax 的长文本处理已形成局部优势,但能否在资本退潮中完成技术闭环,决定其能否穿越周期。就在 6 月 17 日凌晨,MiniMax 突然向开源社区投下 " 重磅炸弹 ",其自主研发的 MiniMax-M1 系列模型正式发布,被定义为 " 全球首个开源的大规模混合架构推理模型 "。在紧随其后的四个工作日里,MiniMax 开启 " 一日一更 " 模式,技术产品 " 五连发 " 震惊市场。
在 DeepSeek 以低成本、高性能模型持续改写行业规则时,国内大模型厂商纷纷采取降价、降价、再降价的策略。这场技术与资本的双重较量,不仅考验企业的技术纵深,更检验其在算力军备竞赛与商业化变现间的平衡能力。
但对亚马逊云科技而言,不追逐短期价格优势,而是通过安全合规、场景深耕等方式构建长期壁垒,或许是一条更为长久的生态共建之路。
每日经济新闻
登录后才可以发布评论哦
打开小程序可以发布评论哦