钛媒体 App 9 月 29 日消息,华为云宣布第完成对 DeepSeek-V3.2-Exp 模型的适配工作,最大可支持 160K 长序列上下文长度。目前,该模型已正式上架华为云大模型即服务平台 MaaS,为企业及开发者提供模型体验和 API 服务。今日下午,DeepSeek-V3.2-Exp 模型正式发布并开源。模型引入稀疏 Attention 架构,可有效降低计算资源消耗并提升模型推理效率。(广角观察)
钛媒体 App 9 月 29 日消息,华为云宣布第完成对 DeepSeek-V3.2-Exp 模型的适配工作,最大可支持 160K 长序列上下文长度。目前,该模型已正式上架华为云大模型即服务平台 MaaS,为企业及开发者提供模型体验和 API 服务。今日下午,DeepSeek-V3.2-Exp 模型正式发布并开源。模型引入稀疏 Attention 架构,可有效降低计算资源消耗并提升模型推理效率。(广角观察)
登录后才可以发布评论哦
打开小程序可以发布评论哦