本文作者:李笑寅
来源:硬 AI
据媒体报道,芯片巨头英伟达正接近达成一项收购 GPU 租赁商 Lepton AI 的交易,交易金额预计达数亿美元。
在算力需求被质疑之际,英伟达这一收购举动是进军云计算领域的重要一环,标志着其与亚马逊和谷歌等主要云提供商的直接竞争。
Lepton AI:一家 GPU" 二房东 "
Lepton AI 成立于 2023 年,总部位于美国加利福尼亚州帕洛阿托,是一家提供 GPU 算力租赁服务的初创公司。
此前,Lepton 曾为游戏初创公司 Latitude.io 和科研初创公司 SciSpace 提供 AI 云服务,其联合创始办人 Yangqing Jia 和 Junjie Bai 曾是 Meta 的 AI 研究人员。
与普通云服务提供商不同,Lepton 不自行管理数据中心或服务器,而是从云提供商租用后再转租给自己的客户——公司实际上不拥有任何 GPU。
分析称,Lepton 这种业务模式将更专注于满足 AI 训练和推理的特定需求,提供优化的 GPU 集群和相关技术服务。对公司而言,这种轻资产模式也使 Lepton 避开重资产投资的财务压力。
在训练方面,Lepton 提供了类似 Slurm 的作业提交方法。实际测试表明,用户只需几分钟就能将现有 sbatch 脚本调整为在 Lepton 平台上工作,转换过程相当直观。
Lepton 平台的另一大亮点在于其可视化能力。
分析称,Lepton 提供控制台仪表盘,用户可以在其中查看节点生命周期,了解每个节点的作业状态。这一节点生命周期可视化功能表现出色,仅次于 CoreWeave。这对于监控和管理 GPU 资源至关重要,能够帮助用户及时发现和解决问题。
算力租赁市场:从卖方转向买方
当前,算力租赁市场正经历深刻变革。
美国知名半导体研究机构 SemiAnalysis 分析指出,计算成本正随时间推移而下降,算力租赁市场已转变为明显的买方市场——现在有超过 100 家 GPU 云服务提供商在争夺基本相同的客户群体,导致价格竞争加剧。
黄仁勋也在上周的 GTC 演讲中发表了类似的观点:
" 当 Blackwell 开始大规模出货时,即使是 Hopper 也将无人问津。"
导致这种现象的关键在于,算力市场的成本由每类 GPU 的成本加权平均值决定。这意味着,具有更低计算成本的系统可用性一旦增加,将推动整体计算成本下降,进而也会拉低旧卡的租赁价格。
举例来说,英伟达 GB200 在推理方面的单位成本(每百万个 token 的美元成本)比 H100 低 75%,在训练方面的成本(每小时每个有效 PFLOP 的美元成本)低 56%。
这意味着,如果 H100 想要保持竞争力,就不得不大幅降价。SemiAnalysis 通过计算得出,为了让客户在使用两种芯片时感觉 " 无差别 ",H100 的每小时租赁价格需要比 GB200 低 65%。
更直观地说,如果 GB200 的租赁价格为每块 GPU 2.20 美元 / 小时,那么 H100 的租赁价格则需要降至每块 GPU 0.98 美元 / 小时。
SemiAnalysis 曾在去年预测,随着 H100 生产的加速,GPU 价格将持续下行,并且考虑到买家将把重心转移到 Blackwell 战略上,这种下降趋势一直持续到 2024 年末。
现实证明,其预测是准确的。
这种竞争格局使得像 Lepton 这样的专业 GPU 租赁商面临巨大压力,也促使英伟达考虑通过收购来整合市场,进一步巩固其在 AI 计算基础设施领域的主导地位。
英伟达的野心藏不住,激进扩张云服务
英伟达 CEO Jensen Huang 被 SemiAnalysis 称为 " 首席营收破坏者 ",这一称号反映了英伟达近年来在计算市场的激进扩张策略。
SemiAnalysis 指出,通过收购 Lepton,英伟达不仅获得了额外的收入来源,还可能挤压其他云服务提供商的生存空间。
进一步说,这种垂直整合策略让英伟达能够从芯片设计到算力租赁的全产业链中获利,同时还能更好地控制其 GPU 芯片的使用方式和价格策略,进一步增强其在 AI 计算领域的主导地位。
目前,英伟达的云和软件业务目前仍处于起步阶段,其模式是英伟达直接向企业出租由其芯片驱动的服务器,并提供软件帮助公司开发 AI 模型和应用程序,以及管理训练 AI 的 GPU 集群。
英伟达此前曾表示,这项业务未来可能产生 1500 亿美元的收入——这一数字超过了英伟达或亚马逊 AWS 目前的年营收额。
登录后才可以发布评论哦
打开小程序可以发布评论哦