快科技 4 月 4 日消息,据报道,DeepSeek 即将发布的新一代大语言模型 V4,已基于包括华为在内的最新国产 AI 芯片完成优化。
报道称,为确保 V4 在国产硬件上顺利运行,DeepSeek 过去数月与华为及寒武纪密切合作,对模型底层程序进行了调整与重写,并同步开展测试验证。
与以往 AI 模型开发优先适配美系芯片的惯例不同,DeepSeek 此次未向美国 AI 芯片供应商开放测试,而是将国产芯片厂商置于优先位置。
此外,DeepSeek 还同步开发了两款针对不同应用场景优化的 V4 衍生版本,同样基于中国芯片设计。
为应对基于该模型云服务上线需求,阿里巴巴、字节跳动和腾讯等科技巨头已提前下单华为新一代 AI 芯片,订单规模达数十万颗。
华为于今年 3 月 21 日在中国合作伙伴大会上,正式发布了搭载昇腾 950PR 处理器的 Atlas 350 加速卡。
昇腾 950PR 芯片基于 SIMD 架构,算力达到 1PFLOPS(FP8)/ 2PFLOPS(FP4),支持 FP32、FP16、BF16、FP8、MXFP8、FP4 等多种数据格式,互联带宽 2TB/s,内存容量 128GB、带宽 1.6TB/s。



登录后才可以发布评论哦
打开小程序可以发布评论哦