快科技 11 月 20 日消息,2024 年世界互联网大会今日在浙江乌镇开幕,腾讯获得全新设立的世界互联网大会杰出贡献奖—创新突破类。
据 " 腾讯 " 公众号介绍,腾讯 Angel 机器学习平台也获得了本年度世界互联网大会领先科技奖。
腾讯称,该奖项被视为科技行业的最高荣誉之一,在 270 个申报项目中,共有 20 个项目获奖。
评选委员会点评腾讯 Angel 机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。
据了解,突破主要在通信、效率、规模三方面实现。
通信:
从网卡到交换机,再到路由协议,腾讯自研的 RDMA 网络实现了集群高速互联,单节点带宽达到 3.2T,相比于同类领先产品,性能提升 30%,成本降低 70%。
效率:
自研了训练 / 推理框架,提出显存加主存的一体化机制,实现多维并行和算子优化,相比开源框架,训练性能提升 2.6 倍,推理速度提升 2.3 倍。
规模:
实现了单任务万卡的线性扩展,GPU 集群加速比从 50% 提升到 99%。
腾讯 Angel 机器学习平台是干嘛的,如果你手握一堆数据,想从零开始训练一个大模型,整个过程可以分成三层,Angel 会在中间层发挥作用。
其中,底层 GPU、云服务器等计算硬件提供算力支持,中层是机器学习平台,负责处理数据、开发算法和执行训练任务,上层是训练好的大模型。
简单来说,Angel 机器学习平台可以把一堆杂乱的数据经过清洗、训练、加工等工序,变成一个强大的大模型。
登录后才可以发布评论哦
打开小程序可以发布评论哦