智东西 8小时前
超10亿!AI Infra开年最大种子轮诞生,清华特奖得主任首席科学家
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 应用风向标(公众号:ZhidxcomAI)

作者|江宇

编辑|漠影

智东西 1 月 23 日报道,昨日,由开源项目 vLLM核心团队创立的 AI 基础设施创企Inferact宣布完成 1.5 亿美元(约合人民币 10.4 亿元)种子轮融资,投后估值达 8 亿美元(约合人民币 55.7 亿元)。

Inferact 创始成员游凯超称:" 我们的使命,是将 vLLM 打造成全球领先的 AI 推理引擎。"

Inferact 创始成员游凯超转载官宣贴(图源:X)

本轮融资由 a16z 与 Lightspeed 领投,真格基金、Sequoia Capital、Altimeter Capital 和 Redpoint Ventures 等跟投。

vLLM 是当前最具影响力的开源推理引擎之一,已支持 500 余种模型架构、适配 200 多类加速器平台,广泛承载全球企业的大规模推理任务,Meta、Google、Character.ai 等公司也已在生产环境中部署使用。

vLLM 社区累计贡献者已超 2000 人,长期位居 GitHub 同类项目活跃度前列。Inferact 正是在这一深厚开源基础上诞生。

vLLM 开源项目主页(图源:GItHub)

Inferact 的创始团队几乎全部来自 vLLM 核心开发者阵营。

Inferact CEO 由 vLLM 原始维护者Simon Mo担任,他曾就读于加州大学伯克利分校电气工程与计算机科学系(EECS),主攻机器学习系统设计方向。他在此前供职的 AI 基础设施公司 Anyscale 积累了丰富的落地经验。

另一位联合创始人是 vLLM 项目的发起人Woosuk Kwon,拥有加州大学伯克利分校计算机科学博士学位,师从于 Ion Stoica 教授(Databricks 联合创始人之一)。

Woosuk Kwon(图源:X)

他提出的 Paged Attention 算法显著提升了 KV Cache 的显存效率,成为 vLLM 吞吐性能提升的关键机制。

团队中的另一位核心人物为首席科学家游凯超(Kaichao You),清华特等奖学金获得者,曾在加州大学伯克利分校 EECS 系担任访问学者。

游凯超(图源:X)

他主导了 vLLM 分布式推理功能的实现,尤其是对张量并行与 PyTorch 生态集成接口的优化,使得大模型推理可在多卡环境中稳定运行,开发门槛显著降低。

此外,前 Roblox 高级机器学习工程师 Roger Wang 作为核心成员加盟。Databricks 联合创始人 Ion Stoica 教授和伯克利计算机科学教授 Joseph Gonzalez 也以深度顾问的身份深度参与项目。

Inferact 方面称,未来将持续以独立开源项目形式支持 vLLM,并将所有改进回馈社区;同时,团队将围绕多硬件平台构建更强大的推理基础设施,助力企业稳定部署 AI 模型并降低运营成本。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 开源 清华 融资
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论