驱动之家 21小时前
首次!突破世纪难题 我国成功研制出新型芯片:算力达顶级GPU的1000倍以上
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 10 月 14 日消息,据科技日报报道,我国成功研发新型芯片算力可超顶级 GPU 千倍,突破模拟计算世纪难题。

近日,北京大学人工智能研究院孙仲研究员团队联合集成电路学院研究团队,成功研制出基于阻变存储器的高精度、可扩展模拟矩阵计算芯片,首次实现了在精度上可与数字计算媲美的模拟计算系统。

该芯片在求解大规模 MIMO 信号检测等关键科学问题时,计算吞吐量与能效较当前顶级数字处理器(GPU)提升百倍至千倍。

相关论文于 10 月 13 日刊发于《自然 · 电子学》期刊。

我们熟悉的通信基站信号处理、AI 大模型训练参数优化等,本质都是在解复杂的矩阵方程。采用数字方法实现高精度矩阵求逆的计算开销极大,耗时长、能耗高。

于是,曾被视为老旧技术的模拟计算重新进入研究视野,它直接利用物理定律实现并行运算,延时低、功耗低,在算力瓶颈背景下,具有先天优势。

但如何让模拟计算兼具高精度与可扩展性,从而在现代计算任务中发挥其先天优势,一直是困扰全球科学界的世纪难题。

孙仲团队选择了一条融合创新的道路,通过新型信息器件、原创电路和经典算法的协同设计,构建了一个基于阻变存储器阵列的高精度、可拓展的全模拟矩阵方程求解器,首次将模拟计算的精度提升至 24 位定点精度。

孙仲介绍,研究团队基于迭代算法,结合了模拟低精度矩阵求逆和模拟高精度矩阵 - 向量乘法运算,开发了一种基于全模拟矩阵运算的高精度矩阵方程求解方案,先快速算出矩阵方程的 " 近似解 ",再用 " 位切片 " 方法,实现迭代细化。

在计算精度方面,团队在实验上成功实现 16 × 16 矩阵的 24 比特定点数精度求逆,矩阵方程求解经过 10 次迭代后,相对误差可低至 10 ⁻⁷量级。

在计算性能方面,在求解 32 × 32 矩阵求逆问题时,其算力已超越高端 GPU 的单核性能;当问题规模扩大至 128 × 128 时,计算吞吐量更达到顶级数字处理器的 1000 倍以上,传统 GPU 干一天的活,这款芯片一天就能搞定。同时,该方案在相同精度下能效比传统数字处理器提升超 100 倍,为高能效计算中心提供了关键技术支撑。

团队将它应用到了 " 大规模 MIMO(多输入多输出)信号检测 " 中——仅用 3 次迭代,恢复的图像就和原始图像高度一致,误码率和 32 位数字计算效果相当,凸显其在实时信号处理中的潜力。

" 我们证明,模拟计算能以极高效率和精度解决现代科学和工程中的核心计算问题。"

孙仲强调,这项突破的应用前景广阔,可赋能多元计算场景,有望重塑算力格局。团队的研究为算力提升探索出一条极具潜力的路径,有望打破数字计算的长期垄断,开启一个算力无处不在且绿色高效的新时代。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

gpu 芯片 吞吐量 北京大学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论