新浪财经 16小时前
面壁智能李大海:率先实现“用AI训练AI”框架,同等条件下比Megatron节省10%资源
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

来源:睿见 Economy

6 月 12 日至 13 日,2026 第八届北京智源大会在北京中关村国际创新中心举行。面壁智能 CEO 李大海出席并演讲。

李大海介绍到,面壁智能一个重要的工作就是用 AI 制造 AI。

他表示," 用 AI 制造 AI" 是今年非常火热的概念。从去年开始,行业就看到一个重要现象,大模型生成的数据质量,已经超过了人类生成数据质量的平均值。这意味着大模型有能力通过模型的数据合成,相对有效地进行进一步的模型训练,即 " 左脚踩右脚 ",慢慢进入到大模型自我训练自我的环节。

他提到,今年,面壁智能也非常关注这一方向,并在行业中率先采用了 " 用 AI 训练 AI" 的框架,成功实现了这一框架,并将这项工作公之于众。" 我认为这是全球最前沿的工作之一,我们非常有幸在行业中率先进行了这样的探索。"

具体而言,这项工作分为两部分。李大海指出,首先,在完成框架后,团队非常严谨地在英伟达平台上将其与 Megatron 进行对比。结果显示,在不需要大模型训练工程师干预的情况下,面壁的智能体框架在同等硬件条件下比 Megatron 节省了 10% 的资源。" 这本身就是一个很不错的成绩。"

此外,在完成对比测试后,团队又在昇腾计算平台上将框架完整跑起来,并训练出了相同的模型。" 这个在昇腾上原生训练出的模型,效果跟在英伟达平台上训练出的模型完全一样。" 李大海表示,这意味着面壁的工作不仅与英伟达平台实现了横向贯通,还在国产芯片上完成了全面适配,并跑出了真实的效果。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 李大海 英伟达 效果 北京
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论