官宣印奇出任董事长仅一周,阶跃星辰再次抛出重磅 " 炸药 "。
2 月 2 日,有着 "AI(人工智能)六小虎 " 之称的国产大模型创业公司阶跃星辰正式发布开源 Agent(智能体)基座模型 Step 3.5 Flash。该模型以 350TPS(每秒生成词元数)推理速度、1960 亿参数稀疏 MoE(混合专家模型)架构及 256K 上下文处理能力,成为国内面向 Agent 场景的又一重磅开源模型。
此次发布距离该公司宣布完成 50 亿元 B+ 轮融资、印奇挂帅(负责整体战略节奏与技术方向的制定)仅一周,更恰逢国内大模型行业新一轮密集上新。就在此前几天,阿里千问与月之暗面相继推出最新旗舰模型,智能体能力成为集体核心卖点。
围绕 AI 如何真正 " 落地办事 "、走向规模化应用的 " 巷战 " 已然打响。阶跃星辰这次更新,究竟解决了 AI 落地的哪些真问题?在这场明星大模型扎堆的技术竞赛中,阶跃星辰又将靠什么破局?
演示跨平台"比价"叩问生态开放 业内呼唤 "API 联盟 "
据阶跃星辰官方介绍,Step 3.5 Flash 模型在单请求代码类任务中推理速度最高可达 350TPS,同时在 Agent 场景和数学任务上,这款开源模型的表现已能媲美主流闭源大模型。阶跃星辰披露的基准测试成绩显示,在数学与推理能力、编码能力、智能 Agent 能力上,该模型的各项表现都排在前列。与此同时,Step 3.5 Flash 能够高效处理 256K 的上下文,胜任复杂、长逻辑链条任务。

基准测试成绩 图片来源:阶跃星辰官微
"Step 3.5 Flash 模型具备很强的底座潜力,标志着国产模型正式从‘参数崇拜’转向‘智能密度’竞争,即从‘更大’转变为‘更聪明’。" 快思慢想研究院创始院长田丰在接受《每日经济新闻》记者采访时指出,Step 3.5 Flash 模型 MoE 架构的效率创新使其能以更低的功耗提供更深的思考,最高每秒 350 个 token(词元)的生成速度表现则解决了终端侧最头疼的 " 打字机效应 "。
田丰进一步解释:" 作为对比,主流大中型模型的文字回复速度平均水平是每秒 20~80 个 token,轻量级模型平均是每秒 80~150 个 token。350TPS 的更高速度意味着首字延迟更短,语音交互能实现瞬时响应,跨多个 Agent 之间的‘内部对话’速度极快。在车载语音交互或手机实时翻译场景下,只有低于 100ms 的首字延迟才能称之为‘通用底座’,用户才能获得丝滑的人机对话体验。"
那么,Step 3.5 Flash 具体能做什么?
在阶跃星辰官方列举的实用场景中,Step 3.5 Flash 可以快速计算复杂数学题并输出正确答案;可以智能体编程,基于一段文字 prompt(提示词),自动编程并输出可视化平台结果。
值得关注的是,在阶跃星辰展示的视频演示中,用户提出对比 Mac Mini M4 在各大电商平台的价格,Step 3.5 Flash 作为 " 云端大脑 ",将这一复杂需求拆解成针对淘宝、京东和拼多多的具体子任务。随后 Step 3.5 Flash 汇总结果,识别出拼多多为最低价平台,并提供购买指南。据称,这种云端规划降低了本地 Step-GUI 的执行难度,使其在从各应用抓取实时数据时获得更高成功率。
对此,知名经济学家、工信部信息通信经济专家委员会委员盘和林向每经记者解读称,这是阶跃星辰进行的 " 一次有效的应用破壁 "," 其应用场景对用户还是有吸引力的,未来也能和电商等 App 融合,从而用 AI 增加电商的获客量,是有可能实现商业化落地的 "。
田丰则对每经记者指出,阶跃展示的网购比价本质是模型对复杂长链条任务的拆解能力,以往 App 之间是信息孤岛,而 Step 3.5 Flash 表现出的 Agent 智能,能够理解 " 比价 " 背后的逻辑(搜价格、算优惠、比库存),这与豆包手机让 "AI 成为系统底层的指挥官 " 思路一致。
他认为,Step 3.5 Flash 接入类似 " 豆包手机 " 这样的深度定制化终端在技术上并不是难题,最大的挑战来自于 " 生态主权 "。
" 技术上,模型已经能在 128GB RAM 的设备(如 Mac Studio 甚至高端国产手机)上流畅运行,但在现实中,如何让淘宝、京东、美团等平台对 Agent 开放深层数据权限,而非简单的网页爬取,这不仅是技术集成,更是商业利益链的重新分配。" 田丰称," 我倡议互联网巨头能够提供标准商业 API(应用程序编程接口)接口、MCP(模型上下文协议)接口,让 Agent 真正站在个人用户角度来提供更好的贴身服务,而非是巨头疆域边界内的‘笼中雀’。"
智能体 " 卡位战 " 升级,阿里、Kimi、阶跃星辰同台竞逐
阶跃星辰此次基座模型的最新发布,恰逢一场围绕 Agent 的行业 " 卡位战 "。
在行业近期的模型密集上新期,智能体能力已成为头部公司竞相角逐的核心之一。1 月 26 日,阿里巴巴发布旗舰推理模型 Qwen3-Max-Thinking,宣称其在 Agent 能力基准测试中刷新了 SOTA(最佳技术表现)纪录;次日,月之暗面开源了万亿参数的多模态模型 Kimi K2.5,同样宣布在开源 Agent 场景中取得了 SOTA 表现。
作为大模型技术落地的关键载体,这些头部公司正多维度加速推进其智能体战略,并展现出各自的鲜明路径。
业务版图宏大的互联网巨头阿里强调 " 模型 + 生态 " 闭环。在今年 1 月 15 日举行的产品发布会现场,阿里宣布其千问 App 全面接入淘宝、支付宝、高德等业务,整合 AI 点外卖、订机票等功能,上线超 400 项服务。
千问 C 端(面向消费者)事业群总裁吴嘉当时表示:"AI 在拥有超强大脑之后,开始长出了能够触达真实世界的手和脚⋯⋯我们的独特优势在于千问最强模型与阿里最丰富生态的结合。" 而近期被官方称为 " 阿里规模最大、能力最强的千问推理模型 "Qwen3-Max-Thinking 的上新为其 Agent 落地应用生态的升级提供了更多期待。
相比之下,AI 原生公司月之暗面选择了一条更 " 炫技 " 的路径:让 AI 学会 " 分身术 "。其最新发布的 Kimi K2.5 模型的核心突破,是从一个 " 超级单兵 " 进化为一支可以随时组建的 "AI 军团 "。
据月之暗面创始人杨植麟介绍,Kimi K2.5 能够即时创建并协调上百个专项 Agent 并行工作,通过无预设的团队式协作处理复杂任务,这意味着其最新模型已经实现从 " 单一智能体 " 到 " 智能体集群 " 的演进,展现出通过多智能体动态调度以攻克超复杂问题的新方向。
同样作为 AI 初创公司,阶跃星辰的新模型则彰显出其以部署成本效率解决 Agent 落地痛点的尝试。Step 3.5 Flash 模型通过稀疏 MoE 与 MTP-3 等技术,在降低激活参数的同时实现高速推理,并坚持全面开源,旨在降低开发者在消费级设备上本地部署高性能 Agent 的门槛。
这一技术方向与公司押注终端场景的战略高度一致。此前,阶跃星辰已与 OPPO、吉利等合作探索手机、汽车等终端侧 Agent 应用。例如,OPPO 已基于阶跃星辰的 Step 系列模型推出 " 一键问屏 "" 一键全能搜 " 等功能,用户可直接指令 AI 进入任意 App 完成任务,真正实现端侧 Agent。
" 随着 50 亿元融资落地以及产业资本的进入,阶跃星辰的重心正快速向手机、PC(个人电脑)及智能座舱倾斜,印奇挂帅则彰显出阶跃星辰‘模硬一体’的战略突破方向。Step 3.5 Flash 极大概率会以端云协同的方式进入定制化终端。虽然车机、手机是目前 AI 主流载体,但我非常期待新型 AI 原生硬件的大胆尝试。" 田丰表示。
他认为,新模型的发布是阶跃星辰不再单纯 " 卷 " 万亿参数闭源大模型的明确信号,它 " 卷 " 的是 " 能跑在端侧的顶级智力 ",如果能继续采用开源战略,或许能抢夺 AI 新硬件市场的 " 安卓地位 "。
在 2025 年 2 月的生态开放日上,阶跃星辰创始人姜大昕曾阐释公司对智能体发展的底层思考,他指出,多模态感知与长链慢思考推理是推动智能体进化的两大关键。随着 Step 3.5 Flash 这一解决复杂、长链条问题能力更突出的技术底座推出,它能在多大程度上赋能阶跃星辰的终端智能体蓝图,仍有待检验。
每日经济新闻


登录后才可以发布评论哦
打开小程序可以发布评论哦