
4 月 28 日,商汤科技发布并开源日日新 SenseNova U1 系列原生理解生成统一模型。发布当日,包括昇腾等在内的 10 家国产芯片公司,第一时间完成了对开源的 SenseNova U1 系列的 Day 0 适配。
从开源开发者平台 GitCode 公开信息获悉,昇腾基于 Ascend 910C NPU 对 SenseNova-U1-8B-MoT 模型进行了适配,并利用 NPU 的融合算子能力,对模型推理进行端到端加速,不仅实现 " 开箱即用 ",更将推理速度显著提升。
信息显示,昇腾通过 CANN 算子编译融合、任务队列优化、精度控制、RoPE 融合等技术,将分散的细粒度算子合并执行,有效减少计算冗余与显存占用。在 2048 × 2048 分辨率图像生成任务中,经融合优化后的推理平均时延从 98.6 秒降至 39.1 秒,整体加速比达到 2.52 倍,在信息图、图文交错生成等场景提升尤为显著。

为方便开发者快速落地,昇腾还在 GitCode 开放了一整套可直接复用的部署方案,包含容器环境配置、依赖安装、模型下载、融合优化、推理脚本等内容,并提供常见问题排查指南。开发者无需复杂调试,按步骤即可完成部署,在保证精度对齐的同时获得最优性能。
SenseNova U1 是一款基于商汤 NEO-unify 架构的原生理解生成统一模型,实现了语言和视觉信息的高效协同,达到开源模型的 SOTA 水平。它在单一模型架构上统一了多模态理解、推理与生成,并在业内首创了连续性图文创作输出,具有高密度信息表达能力。此次开源的 SenseNova U1 Lite 仅凭 8B-MoT 的较小规格,就能达到甚至超越部分大型商业闭源模型。
业内人士指出,国产大模型与国产算力的协同正快速走向成熟。昇腾此次对 SenseNova U1 的 Day0 适配与端到端优化,进一步验证了国产芯片对新一代原生统一多模态模型的商用支撑能力,也为全栈国产化 AI 方案落地提供了可行路径。


登录后才可以发布评论哦
打开小程序可以发布评论哦