印奇挂帅一周抛“端侧王牌” 阶跃星辰Step 3.5 Flash演示电商“跨平台比价”，能否撬动AI终端革命？

官宣印奇出任董事长仅一周，阶跃星辰再次抛出重磅 " 炸药 "。

2 月 2 日，有着 "AI（人工智能）六小虎 " 之称的国产大模型创业公司阶跃星辰正式发布开源 Agent（智能体）基座模型 Step 3.5 Flash。该模型以 350TPS（每秒生成词元数）推理速度、1960 亿参数稀疏 MoE（混合专家模型）架构及 256K 上下文处理能力，成为国内面向 Agent 场景的又一重磅开源模型。

此次发布距离该公司宣布完成 50 亿元 B+ 轮融资、印奇挂帅（负责整体战略节奏与技术方向的制定）仅一周，更恰逢国内大模型行业新一轮密集上新。就在此前几天，阿里千问与月之暗面相继推出最新旗舰模型，智能体能力成为集体核心卖点。

围绕 AI 如何真正 " 落地办事 "、走向规模化应用的 " 巷战 " 已然打响。阶跃星辰这次更新，究竟解决了 AI 落地的哪些真问题？在这场明星大模型扎堆的技术竞赛中，阶跃星辰又将靠什么破局？

演示跨平台"比价"叩问生态开放业内呼唤 "API 联盟 "

据阶跃星辰官方介绍，Step 3.5 Flash 模型在单请求代码类任务中推理速度最高可达 350TPS，同时在 Agent 场景和数学任务上，这款开源模型的表现已能媲美主流闭源大模型。阶跃星辰披露的基准测试成绩显示，在数学与推理能力、编码能力、智能 Agent 能力上，该模型的各项表现都排在前列。与此同时，Step 3.5 Flash 能够高效处理 256K 的上下文，胜任复杂、长逻辑链条任务。

基准测试成绩图片来源：阶跃星辰官微

"Step 3.5 Flash 模型具备很强的底座潜力，标志着国产模型正式从‘参数崇拜’转向‘智能密度’竞争，即从‘更大’转变为‘更聪明’。" 快思慢想研究院创始院长田丰在接受《每日经济新闻》记者采访时指出，Step 3.5 Flash 模型 MoE 架构的效率创新使其能以更低的功耗提供更深的思考，最高每秒 350 个 token（词元）的生成速度表现则解决了终端侧最头疼的 " 打字机效应 "。

田丰进一步解释：" 作为对比，主流大中型模型的文字回复速度平均水平是每秒 20~80 个 token，轻量级模型平均是每秒 80~150 个 token。350TPS 的更高速度意味着首字延迟更短，语音交互能实现瞬时响应，跨多个 Agent 之间的‘内部对话’速度极快。在车载语音交互或手机实时翻译场景下，只有低于 100ms 的首字延迟才能称之为‘通用底座’，用户才能获得丝滑的人机对话体验。"

那么，Step 3.5 Flash 具体能做什么？

在阶跃星辰官方列举的实用场景中，Step 3.5 Flash 可以快速计算复杂数学题并输出正确答案；可以智能体编程，基于一段文字 prompt（提示词），自动编程并输出可视化平台结果。

值得关注的是，在阶跃星辰展示的视频演示中，用户提出对比 Mac Mini M4 在各大电商平台的价格，Step 3.5 Flash 作为 " 云端大脑 "，将这一复杂需求拆解成针对淘宝、京东和拼多多的具体子任务。随后 Step 3.5 Flash 汇总结果，识别出拼多多为最低价平台，并提供购买指南。据称，这种云端规划降低了本地 Step-GUI 的执行难度，使其在从各应用抓取实时数据时获得更高成功率。

对此，知名经济学家、工信部信息通信经济专家委员会委员盘和林向每经记者解读称，这是阶跃星辰进行的 " 一次有效的应用破壁 "，" 其应用场景对用户还是有吸引力的，未来也能和电商等 App 融合，从而用 AI 增加电商的获客量，是有可能实现商业化落地的 "。

田丰则对每经记者指出，阶跃展示的网购比价本质是模型对复杂长链条任务的拆解能力，以往 App 之间是信息孤岛，而 Step 3.5 Flash 表现出的 Agent 智能，能够理解 " 比价 " 背后的逻辑（搜价格、算优惠、比库存），这与豆包手机让 "AI 成为系统底层的指挥官 " 思路一致。

他认为，Step 3.5 Flash 接入类似 " 豆包手机 " 这样的深度定制化终端在技术上并不是难题，最大的挑战来自于 " 生态主权 "。

" 技术上，模型已经能在 128GB RAM 的设备（如 Mac Studio 甚至高端国产手机）上流畅运行，但在现实中，如何让淘宝、京东、美团等平台对 Agent 开放深层数据权限，而非简单的网页爬取，这不仅是技术集成，更是商业利益链的重新分配。" 田丰称，" 我倡议互联网巨头能够提供标准商业 API（应用程序编程接口）接口、MCP（模型上下文协议）接口，让 Agent 真正站在个人用户角度来提供更好的贴身服务，而非是巨头疆域边界内的‘笼中雀’。"

智能体 " 卡位战 " 升级，阿里、Kimi、阶跃星辰同台竞逐

阶跃星辰此次基座模型的最新发布，恰逢一场围绕 Agent 的行业 " 卡位战 "。

在行业近期的模型密集上新期，智能体能力已成为头部公司竞相角逐的核心之一。1 月 26 日，阿里巴巴发布旗舰推理模型 Qwen3-Max-Thinking，宣称其在 Agent 能力基准测试中刷新了 SOTA（最佳技术表现）纪录；次日，月之暗面开源了万亿参数的多模态模型 Kimi K2.5，同样宣布在开源 Agent 场景中取得了 SOTA 表现。

作为大模型技术落地的关键载体，这些头部公司正多维度加速推进其智能体战略，并展现出各自的鲜明路径。

业务版图宏大的互联网巨头阿里强调 " 模型 + 生态 " 闭环。在今年 1 月 15 日举行的产品发布会现场，阿里宣布其千问 App 全面接入淘宝、支付宝、高德等业务，整合 AI 点外卖、订机票等功能，上线超 400 项服务。

千问 C 端（面向消费者）事业群总裁吴嘉当时表示："AI 在拥有超强大脑之后，开始长出了能够触达真实世界的手和脚⋯⋯我们的独特优势在于千问最强模型与阿里最丰富生态的结合。" 而近期被官方称为 " 阿里规模最大、能力最强的千问推理模型 "Qwen3-Max-Thinking 的上新为其 Agent 落地应用生态的升级提供了更多期待。

相比之下，AI 原生公司月之暗面选择了一条更 " 炫技 " 的路径：让 AI 学会 " 分身术 "。其最新发布的 Kimi K2.5 模型的核心突破，是从一个 " 超级单兵 " 进化为一支可以随时组建的 "AI 军团 "。

据月之暗面创始人杨植麟介绍，Kimi K2.5 能够即时创建并协调上百个专项 Agent 并行工作，通过无预设的团队式协作处理复杂任务，这意味着其最新模型已经实现从 " 单一智能体 " 到 " 智能体集群 " 的演进，展现出通过多智能体动态调度以攻克超复杂问题的新方向。

同样作为 AI 初创公司，阶跃星辰的新模型则彰显出其以部署成本效率解决 Agent 落地痛点的尝试。Step 3.5 Flash 模型通过稀疏 MoE 与 MTP-3 等技术，在降低激活参数的同时实现高速推理，并坚持全面开源，旨在降低开发者在消费级设备上本地部署高性能 Agent 的门槛。

这一技术方向与公司押注终端场景的战略高度一致。此前，阶跃星辰已与 OPPO、吉利等合作探索手机、汽车等终端侧 Agent 应用。例如，OPPO 已基于阶跃星辰的 Step 系列模型推出 " 一键问屏 "" 一键全能搜 " 等功能，用户可直接指令 AI 进入任意 App 完成任务，真正实现端侧 Agent。

" 随着 50 亿元融资落地以及产业资本的进入，阶跃星辰的重心正快速向手机、PC（个人电脑）及智能座舱倾斜，印奇挂帅则彰显出阶跃星辰‘模硬一体’的战略突破方向。Step 3.5 Flash 极大概率会以端云协同的方式进入定制化终端。虽然车机、手机是目前 AI 主流载体，但我非常期待新型 AI 原生硬件的大胆尝试。" 田丰表示。

他认为，新模型的发布是阶跃星辰不再单纯 " 卷 " 万亿参数闭源大模型的明确信号，它 " 卷 " 的是 " 能跑在端侧的顶级智力 "，如果能继续采用开源战略，或许能抢夺 AI 新硬件市场的 " 安卓地位 "。

在 2025 年 2 月的生态开放日上，阶跃星辰创始人姜大昕曾阐释公司对智能体发展的底层思考，他指出，多模态感知与长链慢思考推理是推动智能体进化的两大关键。随着 Step 3.5 Flash 这一解决复杂、长链条问题能力更突出的技术底座推出，它能在多大程度上赋能阶跃星辰的终端智能体蓝图，仍有待检验。

每日经济新闻

宙世代

一起剪

相关标签