(来源:电子创新网)
过去一年,AI 行业发生了一件被严重低估的变化:模型不再稀缺,Token 开始爆炸。当每一次对话、每一次生成、每一个智能体决策都在吞噬算力,问题已经不再是 " 模型够不够强 ",而是——有没有一套算力体系,能把这场 Token 洪流接住。
就在这个临界点上,摩尔线程给出的答案不是一块 GPU,而是一整套 " 打穿云边端 " 的算力底座。
5 月 18 日,摩尔线程在北京举办主题为 " 词元时代,万物智能 " 的年度产品发布会。在 Agentic AI 驱动词元(Token)需求呈指数级跃升的关键节点,万物智能处于爆发前夜,算力的基石作用愈发关键。
摩尔线程在此次盛会上全方位展示了其作为智算底座的战略纵深,全面展示了 " 云 - 边 - 端 " 全栈智算矩阵:从万卡级规模的夸娥智算集群,到自研 " 长江 "SoC 驱动的智能终端 MTT AICUBE 和 MTT AIBOOK;从数字世界智能体 " 小麦 ",到加速物理 AI 落地的首个全栈具身智能仿真平台 MT Lambda,再到持续进化的 MUSA 生态。这不仅是摩尔线程核心技术和产品的集中亮相,更标志着其全面打通了 " 云 - 边 - 端 " 智能算力生态,赋能从数字世界到物理世界的全场景 AI 应用。
云端筑基:夸娥智算集群,全链路加速大模型训推
在智算基础设施领域,摩尔线程以夸娥(KUAE)智算集群为核心,构建起适配词元时代需求的高性能 AI 基础设施。目前,夸娥万卡级智算集群已经成功落地,多项关键指标达到国际主流水平,在 Dense 大模型训练中的模型算力利用率(MFU)达 60%,在 MoE 大模型上达 40%,有效训练时长达 90%,训练线性扩展效率达 95%。这标志着摩尔线程已具备支撑超大规模模型稳定训练的硬核实力。
大模型训练是一项极为复杂的系统性工程,涵盖预训练、持续预训练(CPT)、长文本训练、微调(SFT)及强化学习(RL)等流程。为赋能开发者,摩尔线程推出夸娥训练套件,覆盖大模型预训练和后训练全链路,包括训练框架、AI 框架及训练辅助工具等核心组件,专门优化了对强化学习的支持,兼容业界主流的 VeRL 训推一体与 Slime 训推分离框架,并完成了对多项微调框架的适配。面对高达数十万亿 Tokens 的超大规模数据集,基于摩尔线程万卡级集群训练的科学基础大模型,实现了全流程训练技术的突破,在 MMLU 等评测指标上的表现持续提升。
在推理端,摩尔线程展现了其深厚的生态底蕴与 " 发布即适配 "(Day-0 适配)的响应速度。目前,摩尔线程已全面适配 DeepSeek、GLM、MiniMax、Kimi、Qwen 等国内头部大模型,以及主流的语音、视觉理解及多模态模型。值得一提的是,摩尔线程在推理框架 SGLang 主线代码中获得了官方原生支持,并开源了 vLLM-MUSA,可原生获得摩尔线程 GPU 加速能力,大幅提升推理效率。
夸娥云服务以 " 算力即服务 " 的方式,将前沿模型推理能力快速转化为可用的行业应用:现场展示了基于 GLM 模型推理服务的 Vibe Coding,用户用口语描述需求即可生成专属 App,整个开发由多智能体协同完成,无需手写代码;同时以 AIGC 微短剧制作工作流 , 呈现从剧本策划到视频合成的全链路智能生成,直观展示夸娥在内容创作与智能化应用落地上的强大生产力。
终端进阶:" 长江 "SoC 驱动,开启全场景智能
发布会上,以 " 小麦 " 智能体为核心的端侧 AI 产品正式亮相。基于情景感知决策、长上下文历史检索、自主任务编排、多模态情绪识别以及跨端协同、端云一体的能力," 小麦 " 可以提供有温度的专属人格体验。其背后依托三大关键技术支撑:运行于 AI 原生操作系统 MTT AIOS,采用独特的二维拓扑记忆系统,搭载自研 Agent 开源框架 MTClaw。
为承载 " 小麦 " 智能体的智慧进化,摩尔线程重磅发布了全新智能家庭 AI 中枢—— MTT AICUBE,标志着 Agentic AI 将走进千家万户。它深度整合了 " 智能体 + AI PC + AI NAS" 三大核心能力矩阵,以一站式解决方案赋能家庭智能体验。AICUBE 内置的 " 小麦 " 智能体预装 60 余项技能(Skills),支持超 36 款 APP 的跨应用控制,提供智慧化的主动服务;全闪存 AI NAS 模块则为家庭数据提供了安全、高效的本地存储与智能管理;同时,AICUBE 还具备完整的桌面 AI PC 能力,可轻松满足家庭用户的观影娱乐、高效办公、在线学习、云游戏以及本地大模型运行等全方位需求。AICUBE 将于 6 月 18 日在京东摩尔线程旗舰店开启预售。
与此同时,摩尔线程宣布 MTT AIBOOK 全面升级。作为 " 为智能体而生 " 的笔记本电脑,AIBOOK 在 MTT AIOS 原生 Linux 系统下,预装原生 " 龙虾 " 智能体(OpenClaw),支持多智能体协作,为智能体应用的开发、调试与部署提供完整的闭环解决方案。AIBOOK 具备 " 工具直达 " 特性,提供 90+ 工具调用接口,降低开发配置成本;并创新支持原生 Linux、虚拟化 Windows 及容器化 Android 多系统,同时提供 LLM/ASR/TTS/OCR 等模型支持的 " 端侧感知 " 能力,一台设备即可覆盖用户的全场景使用需求。
面向端侧和边缘场景,摩尔线程以 " 长江 " 智能 SoC 为核心构建多维产品矩阵:除 AICUBE 与 AIBOOK 外,还展示了专为嵌入式边缘场景设计的 MTT E300 AI 模组,支持混合精度计算,可在严苛环境中稳定运行,为工业质检、能源巡检、智慧教室、具身智能、智能汽车及低空经济等典型场景提供高效、低延迟、强可靠的边缘 AI 能力。
物理跨越:生态闭环,赋能具身智能训练与仿真
摩尔线程重磅发布其首个全栈具身智能仿真平台 MT Lambda,旨在赋能用户构建数据合成、策略训练、仿真验证的高效工作流。该平台构建了从底层算力、核心引擎到上层框架及工具的完整解决方案:其底层基于全功能 GPU,实现渲染、物理、AI 计算在同一芯片中完成,数据 " 零拷贝 ";中间层深度融合自研物理、渲染、AI 三大引擎;上层则提供 MT Lambda-Lab 具身策略开发与训练平台以及 MT Lambda-Sim 高保真物理仿真与渲染平台。在发布会现场,摩尔线程通过机器狗实景演示,直观展现了该平台在具身智能策略开发与动作训练上的卓越表现。
当前,具身智能加速从技术验证迈向工程化与产业化,摩尔线程作为国内极为稀缺的打通 " 大模型训练—仿真模拟—端侧部署 " 生态闭环的 GPU 企业,已经构建起全栈自主、端到端的软硬件技术栈,可以为具身智能提供一站式、安全可靠的国产算力方案。
在具身智能领域,摩尔线程依托自研的夸娥智算集群、仿真平台及端侧 SoC 芯片,已经形成云边端协同的产品与能力布局。同时,摩尔线程积极拓展具身生态 " 朋友圈 ",通过与光轮智能在合成数据等关键领域共筑国产具身智能仿真底座,以及与光线云联合打造 RaysTwins 具身仿真平台等深度合作,共同推动技术成果加速转化落地。
生态进化:MUSA 100% 兼容,开源与开放共建
作为贯穿摩尔线程全功能 GPU 硬件与全栈软件体系的底层架构,MUSA 已全面实现对业界主流 CUDA 生态的深度兼容。最新发布的 MUSA SDK 5.1.0,对标 CUDA 12.8,从驱动与运行时新增 248 个 API,兼容接口数达到 761,到核心数学库的 100% 对齐,从覆盖 55 类核心 AI 算子,到完整支持 PyTorch 全部 3194 个算子,MUSA 软件栈全链路覆盖了底层驱动、编译器、算子加速库、训练与推理框架,让国产 GPU 真正具备 " 即插即用 " 的开放能力。
在开源生态与关键场景中,MUSA 也取得了里程碑式的突破:在推理生态上,MUSA 不仅正式成为 vLLM 官方后端,更成功合入 SGLang 官方主线并获得 " 原生支持 ";在底层编译上,TileLang-MUSA 成功合入开源主线,升级支持 Trition 3.6 最新版本,FlashAttention3 等热点算子在 MUSA 上达到 95% 的极致效率;此外,训练套件产品化支撑超大规模集群与强化学习,推理套件全面适配主流框架。无论是前沿大模型训练,还是科学计算中的 VASP 加速,MUSA 都已交出成熟答卷。
更具前瞻性的是,MUSA 正引入 AI 技术加速生态的自我演进。依托 Automusify 智能迁移工具的 " 零干预 " 自动化转化,MUSA 实现了对 Top 100 人工智能与 Top 100 科学计算两大领域加速仓库的 100% 自动迁移。同时,全新升级的 MUSACODE AI 编程助手通过大模型智能体协同,已成功开发并交付超 10,000 个 Kernel 算子,基于 TileLang 自动调优 Group GEMM 算子实现 60% 性能提升。
MUSA 不仅是国产 GPU 的生态底座,更是一个开放、自进化、与开发者共同成长的智能生态。未来已来,我们诚邀您一同加入 MUSA,共创国产算力的新篇章。


登录后才可以发布评论哦
打开小程序可以发布评论哦