AMD 宣布,对 ROCm 软件栈进行了更新,推出了新的迭代版本 ROCm 6.2,巩固了作为人工智能和高性能计算开发平台的领先地位。这一新版本里,AMD 在性能、效率、可扩展性方面都做了提升,无论从事前沿 AI 模型的研究、新一代人工智能应用的开发,或是复杂的优化模拟,都能从中获益。
ROCm 6.2 共有五大核心功能提升,包括:
扩展了专为大语言模型(LLMs)所设计的 vLLM 的支持,提升了 AMD Instinct 系列加速器的 AI 推理能力;
对 ROCm 中的 Bitsandbytes 量化技术支持,提升了 AMD Instinct 系列的 AI 训练和推理能力,增强内存效率与性能;
通过全新的离线程序创建工具,简化了 ROCm 的安装过程;
全新的 Omnitrace 和 Omniperf 性能分析工具(Beta 版),从而在 AMD ROCm 中引领 AI(人工智能)与 HPC(高性能计算)开发的变革;
更加广泛的 FP8(数据处理方式)支持,通过使用 ROCm 6.2 增强了 AI 推理能力。
AMD 表示,通过 ROCm 6.2 再次展示了其为人工智能和高性能计算领域提供强大、有竞争力且富有创新性解决方案的承诺,开发人员拥有了突破边界所需的工具和支持,开发人员可以将项目提升至前所未有的性能和效率水平。
超能网公众号
扫码关注我们,浏览热门硬件评测
随时查看最新天梯榜
登录后才可以发布评论哦
打开小程序可以发布评论哦