36氪 前天
开源异构算力调度平台「密瓜智能」获复星创富数千万元投资,为企业提供高效灵活算力解决方案
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

大模型时代的降临,让   GPU   算力成为了比黄金更稀缺的硬通货。然而,一边是企业对算力的饥渴,另一边却是算力资源的浪费。由于缺乏高效的虚拟化管理工具,全球   GPU   的平均利用率往往徘徊在   10%-20%   之间,大量的显存与算力在 " 静态分配 " 的模式下处于闲置状态。

36 氪近日获悉,异构算力虚拟化、高效调度管理平台「密瓜智能」(Dynamia.ai ) 完成天使轮融资,本轮由复星创富领投,拙朴资本和种子轮投资人跟投。据悉,天使轮融资金额为数千元人民币,资金将主要用于   HAMi   开源生态建设及异构算力调度平台的产业化落地。

异构算力的 " 碎片化 " 困局

随着国产算力与多样化   AI   芯片的不断发展,企业内部算力环境呈现出更加多元与复杂的特征。不同架构、不同厂商的   GPU   与   AI   加速芯片在同一基础设施中并存,使算力资源在管理、调度与使用层面面临新的挑战。

在实际落地过程中,企业普遍需要应对异构算力资源难以统一调度、资源共享效率不足以及算力利用率不高等问题,这也成为当前   AI   基础设施建设中等待解决的关键环节。密瓜智能的核心突破点在于其发起并主导的  CNCF(云原生计算基金会)开源项目   —— HAMi。作为全球唯一专注异构算力虚拟化的   CNCF   项目,HAMi   的目标是成为算力调度领域的 " 统一语言 "。

算力分配

异构算力池化:从 " 静态独占 " 向 " 动态解耦 "

密瓜智能通过   HAMi   构建了一套深度虚拟化与池化管理体系,实现了算力资源与物理硬件的深度解耦 。其核心技术能力体现在以下维度:

细粒度切分与显存超卖:支持将单枚   GPU   的显存与算力进行精度达   1/10   甚至更小的切分,并引入 " 显存超卖(Over-provisioning)" 机制,确保多个高并发任务在资源共享时互不干扰,大幅提升单卡承载密度 。

跨厂商异构统一适配与动态   MIG:已完成对   NVIDIA、华为昇腾、沐曦、摩尔线程、寒武纪、海光、燧原等   9   种以上芯片的适配,并支持 动态   MIG(Multi-Instance GPU) 灵活配置,使不同架构算力能进入同一资源池标准化管理 。

自动弹性扩缩容与优先级机制:支持显存自动弹性扩缩容及   OOM   抑制,配合任务优先级抢占机制,确保核心业务在资源紧张时获得优先保障 。

云原生零侵入与高性能   Turbo   模式:通过 高性能   Turbo   模式 优化调度效率,且实现与   Kubernetes   生态的原生融合。用户无需修改代码,即可在生产环境中实现算力的自动感知与分配 。

在顺丰科技的应用案例中,密瓜智能实现了在仅有的   6   张   GPU   上成功部署了   19   个测试服务,原本需要   19   张卡才能运行的任务,现在节省了   13   张卡,资源效率提升了   2   倍以上。而在越南   AI   学习平台   PREP EDU   的案例中,面对   RTX 4070   与   4090   混装的复杂异构环境,HAMi vGPU 调度能力加上 PREP EDU 的 Devops 团队对其工作流程进行了大量优化,实现了 GPU 集群痛点减少 50%,GPU 基础架构优化了 90%。

除了开源的产品外,密瓜智能还提供企业级的付费产品,企业成立仅一个季度内,便获得了 200 万元的产品订单合同,并获得了   AWS   推理芯片的主动适配支持。

在实际应用中,HAMi   作为开源项目,已被多家企业与开发团队用于异构   GPU   资源共享与调度场景。  在顺丰科技的应用案例中,实现了在仅有的   6   张   GPU   上成功部署了   19   个测试服务,原本需要   19   张卡才能运行的任务,现在节省了   13   张卡,资源效率提升了   2   倍以上。而在越南   AI   学习平台   PREP EDU   的案例中,面对   RTX 4070   与   4090   混装的复杂异构环境,HAMi vGPU 调度能力加上 PREP EDU 的 Devops 团队对其工作流程进行了大量优化,实现了 GPU 集群痛点减少 50%,GPU 基础架构优化了 90%。

算力调度

在此基础上,密瓜智能围绕   HAMi   打造了面向企业客户的商业化产品与技术服务,为企业在生产环境中落地异构算力调度提供更完善的工程能力、稳定性支持与持续运维保障。目前,公司已与多家企业客户开展付费合作,逐步推进从开源项目到企业级解决方案的商业化落地。

从开源基因到商业闭环

密瓜智能核心创始团队长期深耕云计算、云原生及   AI   基础设施领域。CEO   张潇曾在云原生领域头部企业 DaoCloud 担任容器团队负责人;联合创始人 CTO 李孟轩曾任第四范式异构算力技术负责人。两位创始人均是   Kubernetes   核心贡献者及多个   CNCF   项目的维护者(/ 长期参与   Kubernetes 及 CNCF 生态相关开源项目)。近年人工智能发展迅速,云原生基础设施已经成为   AI   时代的首选,容器管理作为构建云原生平台的基石,已经发展成为推动人工智能应用落地的关键技术。密瓜智能团队围绕异构   GPU   资源共享与统一管理方向展开探索,并在此基础上创立了密瓜智能,推动相关能力向工程化与企业级场景落地。

密瓜智能创始人张潇表示:"在算力自主化的大背景下,异构算力池化技术不仅是提升效率的工具,更是国产芯片进入主流生产环境的‘最后一公里’。就算是拿了融资,算力调度和生态建设需要的也是‘耐心资本’。我们不追求激进的短期商业化,而是坚持通过开源社区   HAMi   建立行业的‘事实标准’。我们的愿景是让异构算力像水电一样,因为开源而变得简单好用,真正构建起全球领先的算力调度生态,赋能   AI   产业的高效落地。"

投资人观点:

复星创富投资执行总经理叶丽娟表示,异构将成为算力市场的长期格局,无论是 GPU 还是新型算力芯片,是 AI 最重要的底座,密瓜智能在 AI 大生态中不可或缺地链接算力端与应用端,为客户极大程度提升算力效率,节省昂贵的算力成本。开源的   HAMi   已建立起颇具规模的开发者与用户生态——这一路径也与 AI 行业开源化、协同化的发展趋势高度契合。HAMi   提供的灵活、弹性、按需且可靠的虚拟化技术,能够实现算力的高效切分与调度,显著提升算力利用率,从而为全球客户带来极具竞争力的投资回报率(ROI)。

拙朴投资总监陈敏洁在与密瓜智能的沟通中提到,在上一代以 CPU 为核心的云计算时代,诞生了像 VMware 这样的虚拟化巨头。如今到了以 GPU 为核心的   AI   智算时代,AI 任务负载对算力的需求与底层硬件分配方式之间也同样存在巨大的错配,虚拟化是通向 AI 普惠的核心钥匙。

国产算力多元异构百家争鸣的现状,也赋予 HAMi   开源更深远的意义,开源不再只是情怀,而是生存发展的必需,是对当前算力秩序的重塑。HAMi   想要打破硬件的藩篱,让算力成为像水一样随手可得的公共基础设施,帮助多元异构芯片与全球生态共振。在这一趋势中,HAMi   有望成为异构算力调度虚拟化的全球通用标准。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 开源 gpu 复星创富 天使轮
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论