钛媒体 03-13
毅伯智算发布DeepSeek满血版一体机,性能超英伟达四成
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

为向行业提供真实、可验证的推理性能,软硬协同算力解决方案提供商毅伯智算,近日向市场全新推出搭载满血版 DeepSeek-R1-671B 的 8 卡推理一体机 TORA3000,其推理性能相比英伟达 H20-141G 高出四成,达到业界领先水平,并且实现了硬件、组网、功耗的综合成本最优。 

毅伯智算是国内少有的实现全栈自研的软硬协同算力解决方案提供商,团队凝聚了超百人的 AI 工程师,其中核心成员在人工智能与超算领域拥有超 10 年的研发经验。过去三年,团队始终致力于全栈式 AI 训推平台的研发,并于 2024 年依托新组建的毅伯智算主体,推出了全栈式 AI 训推平台。2025 年 3 月,毅伯智算进一步推出搭载 DeepSeek 模型的自研 8 卡推理一体机 TORA3000。

TORA3000 是软硬件一体化解决方案,开箱即用,全面满足客户推理需求。毅伯智算凭借其软硬件一体化的综合优势,提供最具性价比的一体机解决方案,1 机 8 卡即能实现上述性能,显著降低客户硬件成本,原生支持 DeepSeek-R1-671B 所采用的 FP8 精度,兼容 FP64/32/16 及 INT8,在保证推理精度的同时有效降低部署成本,通过全自研的算子库、编译技术、推理框架等技术手段,实现更快计算效率、长文本和高并发请求支持、更高推理性能。 

对于企业用户来说,Deepseek 推理一体机选择满血版还是蒸馏版?本质上,满血版与蒸馏版类似于教师和学生的关系,即前者是知识输出者,后者通过知识蒸馏过程继承前者的知识。在实际应用中,满血版可深度处理代码生成、知识图谱构建等高复杂度任务;而蒸馏版作为学生模型,受限于知识压缩与固定架构,仅适用于应用特别定义且相对简单场景。对于大中型企业,至少需配置满血版一体机作为核心引擎,以支撑业务迭代与高密度推理需求。

受 GPU 硬件性能的限制,市场上满血版推理一体机存在单机、双机甚至四机等多种部署方案,但是双机方案相对单机方案的硬件成本和功耗会都会翻倍,四机则更高,并增加额外的组网和运维成本。在 Deepseek 原生 FP8 精度下,一体机(8 卡)要流畅运行满血模型,单卡显存需大于 120G(整机显存大于 1000GB),显存不足则必须采用多机部署。同时,部分 GPU 不支持 FP8 运算,只能量化为 INT8 或 FP16 模型,但 INT8 精度下,推理精度会所有下降,FP16 会导致所需显存和节点数量翻倍。为降低部署成本、简化部署复杂性并保证性能,1 台标准 8 卡服务器上部署原生 FP8 精度的 DeepSeek-R1-671B 模型是最优选择,但此方案要求 GPU 支持 FP8 精度且单卡显存超过 120GB,而目前市场上仅有毅伯智算的 TORA3000 和英伟达 H20-141G 可以满足。经采用开源数据集和开源测试工具对两者推理性能进行测试发现,毅伯智算的 TORA3000 相比英伟达 H20-141G,性能提升达 40%,达到业界领先水平。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

一体机 英伟达 ai gpu 人工智能
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论