雷锋网 21小时前
百万级Token秒生成,九章智算云如何突破算力性能瓶颈?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

"Manus 单次推理便可能消耗 100 万个 Token,Agent 起势所带来算力需求增速将超过算力成本下降速度。" 投资人泽彦告诉雷峰网。

美元基金投资人日昊同样判断,大规模视频生成与 Agent 调用将引发指数级算力消耗,带来上千倍算力需求增长,推动算力市场从当前百亿级迈向万亿级。

智能化转型是当下科技变革中最为确定性的机会。九章云极 DataCanvas 公司董事长方磊表示,当下的计算模式正产生从移动互联网的 " 带宽式应用 " 到 AI" 计算密集型应用 " 的结构性变革。

在计算需求从 " 数据传输效率 " 向 " 算力处理能力 " 核心迁移的背景下,算力昂贵、技术门槛高企却成为各行业智能化转型中最为现实的桎梏。

基于此,AI 原生的智算云平台将成为平衡效率与成本的更优解。九章云极智能计算论坛上,新一代全栈智能计算云平台——九章智算云 Alaya NeW Cloud 2.0 正式发布。

"AI 原生智算云平台超越了单点支撑 AI 的方式,是以 AI 为设计初衷、以公有云为载体的平台化人工智能基础设施,通过一体化的能力实现人工智能应用全生命周期的性能最大化,兼具灵活性、伸缩性和专用性,且在价格上比通算云服务更具经济性。"Forrester 副总裁兼首席分析师戴鲲说。

突破瓶颈、降低门槛、优化成本,九章智算云平台如何加速算力普惠?

Serverless 新型云架构:端到端性能提升 5 倍、成本降低 60%

伴随智能化转型浪潮,全球科技企业在算力基建领域掀起从万卡集群到百万卡集群的军备竞赛。超大规模算力资源池解决了 " 有算力可用 " 的问题,而当算力规模达到一定层级," 高效利用 " 成为决定算力价值释放的核心命题。

如何突破当下的算力使用效率瓶颈?新型云架构是核心。

传统裸金属的算力调度面临严重的利用率低下问题,如 OpenAI 在 GPT-4 训练中投入 2.5 万张 A100 GPU,历经 90-100 天运算,算力利用率仅 32%-36%。赛富投资基金合伙人蒋驰华表示,2024 年上半年全球 AI 基础设施支出同比激增 97% 至 474 亿美元,其中 72% 的 AI 服务器收入源于云端服务,印证云服务模式推动算力普惠已成趋势。

九章智算云通过 Serverless 技术架构替代传统虚拟化模式,构建统一高效的弹性底座,实现算力资源最大化复用。对于用户而言,云上服务可避免裸金属服务器资源利用率低、运维成本高、部署周期长、弹性扩展难、技术门槛高等问题。其推动算力调度从 " 配置机器 " 向 " 提交任务 " 转变,让 AI 开发者无需关注底层调度,专注业务逻辑与模型调用。

完成全栈优化的九章智算云,支持跨 AIDC 弹性资源调度,实现秒级响应与无限扩展,通过弹性伸缩自动完成环境配置与任务监控,端到端性能提升 5 倍。

高效之外,降低使用门槛同样关键。与头部科技企业不同,数量庞大但技术能力薄弱的企业亟需低门槛智能开发工具。

某大型集团曾投入 3000 万元研发企业大模型,虽高薪聘请技术专家,却因技术落地障碍、数据隐私风险及商业模式不清晰等问题,一年内资金耗尽导致项目终止。

面对 " 落地难 " 等问题,九章智算云发布系列低门槛智算工具链,覆盖大模型从预训练、精调直至适配与应用开发的 ModelOps 全生命周期,大幅降低模型开发与应用的技术壁垒。

通过这些工具链,用户无需掌握复杂的 GPU 配置和集群管理技术,仅需明确数据来源、选定模型基座、确定优化方向,系统即可自动编排计算流程,真正实现对 AI 算力的 " 驾驭 "。

为了让技术落地门槛彻底降低,九章云极同期发布了九章强化学习云平台 AgentiCTRL,基于混合专家(MoE)架构,首创性地将强化学习能力深度融入基础设施,显著增强大模型推理能力,将 AI 智能体训推门槛压缩至 " 一行代码 "。

与传统强化学习方案相比,该平台在性能、成本和规模三方面均具备优势。其端到端训练效率提升 500%,综合成本下降 60%,成为全球首个支持万卡级异构算力调度的强化学习基础设施平台。

可用之外,成本可控是关键。正如方磊所言,十卡至百卡规模的算力需求群体构成的市场庞大。

九章智算云以 " 按度计费 " 模式替代传统裸金属租赁,将企业总拥有成本(TCO)降低 60%,使 AI 算力成为更多企业可负担的生产要素。

九章智算云通过 " 技术架构创新 + 工具链下沉 + 经济模型重构 " 的三维路径,实现从 " 有算力可用 " 到 " 有高效算力可用 " 的跨越。这种 " 基础设施即服务 " 的模式,不仅破解了算力效率瓶颈,更让 AI 技术从头部企业的 " 专利 " 变为千行百业的 " 通用生产力 ",推动智能化转型进入深水区。

「开源开放」是算力规模化应用的核心驱动力

大模型技术演进、企业垂直模型落地及 Agent 规模化应用推动智算市场规模化增长。《2025 年中国人工智能计算力发展评估报告》显示,中国智能算力规模将达 1037.3EFLOPS,同比增长 43%。

当前算力建设持续升温,但产业供需错配问题突出,智算中心资源点亮率仅 20%。IDC 数据显示,国内百万 AI 开发者中,83% 因算力成本约束无法开展模型训练。

针对算力利用率不足的行业痛点,九章智算云突破传统 GPU 租用模式,推出 " 一度算力 " 按需计费标准,以按量计费模式重构算力消费生态。

九章智算云依托 Serverless 架构实现 GPU 资源池化管理,构建 " 算力即服务 " 的弹性供给体系,千卡级训练任务与十卡级微调需求可共享同一资源池,使算力使用成本较传统方案降低 45%。

创新计费模式之外,生态协作是解决供需错配的另一关键要素。产业内上下游的开放协作,能加速对用户需求的理解,从而实现算力向智能成果的高效转化。九章云极将开放生态建设作为长期战略,与业内企业展开深度合作,推动智能化应用在不同领域的规模化落地。

算力布局具有前瞻性,模型、Agent 及应用发展虽已成为行业共识,但算力基建需先于应用浪潮部署,这导致算力项目建设与算力消纳在时间维度上存在难以消除的间隙。

为加速破解算力供需时间上错配的难题,九章云极发起 "AI-STAR 企业生态联盟 ",首期注资 1.8 亿元,从产业源头打通供需链路。

方磊表示,未来三年,九章云极将在 AI 高端算力、模型、低门槛工具链、智能体应用、工程化交付等领域以 " 开放服务市场 + 生态基金投资 " 模式,构建中国繁荣的 AI 智算云开放生态。

"AI-STAR 企业生态联盟 " 将根据生态合作伙伴产品成熟度,提供从技术到商业化所需的云端资源及算力支持,帮助企业在 AI 领域探索创新,实现从场景探索到规模化、商业化的目标,为各行业客户提供 AI 算力支持和服务。

迄今为止,九章智算云 Alaya NeW Cloud 平台上支持大多数国际主流基座大模型,开源社区衍生模型也取得里程碑式突破。正如方磊所说,开源开放是加速 AI 普及与规模化的核心驱动力。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

九章 ai 云服务 基础设施 人工智能
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论