正和岛 04-01
​科大讯飞刘庆峰:企业如何拥抱AI?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

3 月 29 日 -30 日,2025 正和岛案例共学大课 · 安徽站在合肥举办,本次大会以 " 赢在 AI+,与趋势共舞 " 为主题,300 余位企业家齐聚合肥,共同探讨企业家如何驭势而上,企业如何借 AI 实现价值跃迁。

在大会上,科大讯飞董事长刘庆峰做了分享," 如果今天不让自己的企业和生命运行在大模型之上,大概率现在所有靠人力和市场的商业模式都会在一两年内被彻底颠覆掉。"

他从大模型的发展阶段出发,提出目前大模型还有很大的增长空间,并分享了科大讯飞作为唯一国产范围构建的自主可控大模型如今的发展情况,以及未来准备为企业提供的服务。

以下内容为本次演讲内容精编,希望对你有所启发。

口   述:刘庆峰   科大讯飞董事长

编   辑:一厘米

来   源:正和岛(ID:zhenghedao)

各位企业家朋友,大家好。我将从两个角度做个分享。

首先,我们如何看待当前技术发展的趋势,以及下一步产业可能带来的变革性影响。其次,企业如何抱团,如何发展 AI。

AI 大模型离天花板还很远

今天的底座大模型实际上还有很大的增长空间。

大家都知道,DeepSeek 在春节前出圈,随后 OpenAI o1 将其升级为 o3-mini,最近又出了 GPT-4o 的升级版本,对图片的理解、逻辑推理与创造力都有所提升。

在硅谷,其实还有一个比 OpenAI 更难进的公司 Anthropic,它有很多物理学博士,那些天才们都特别想加入。

它的 CEO Dario Amodei 发了一篇长文,大胆预言:两年内," 强大 AI" 将达到诺奖级智商水平。

目前大家对通用人工智能发展大致分为几个阶段,虽然各个角度不同,但是基本认知相对一致。

第一步是对话者。通过对话控制人工智能,只要进行语言提示,就可以激发他们学习、记忆、训练内容。

第二步是智能行动者,可以完成相关指令的工作。

第三步是智能体,它可以自动听懂你的指令,并将其分解成相关任务,找到每个任务完成所需的工具,之后再对接内部和外部信源,将它们组合起来完成任务。

第四步是创新者,不仅可以完成既定工作,还可以自己创意和创新。

第五步是组织者,到后期它就具备整合社会要素资源整和调度能力,大致分为这几个阶段。

目前,我们基于大模型,为央国企业做了很多智能体平台。

他们不需要编程,只需要理解场景并提出要求,我们会自动帮助他申请相关工具。中国能源通过这种方式已经有 50 多个非常优秀的智能体工具在全集团内部使用。

其最大意义在于随着大模型语言理解能力和编程能力的提升,我们已经拥有越来越多专项的人工智能技术。因此,智能体平台在下一个阶段对各企业非常关键。

在第四个阶段中,创新者是什么概念?前年中央经济工作会议上明确提出,要将科技、人才、教育三位一体,并在经济工作中排名第一的是创新。

目前全球范围内非常清楚的是,AI for science 大模型是未来创新的最重要的助推器和底座支撑。去年诺贝尔化学奖和物理学奖分别颁发给了大模型与人工智能相关的科学家。

我给大家举个例子,中国科学技术大学生命学院的刘海燕教授团队,要做蛋白质的结构预测,生成活性蛋白质。原来需要 6 个月做的实验,现在借助科研大模型一天就做完了,已经做出 48 个活性蛋白质,并且在《Nature》上发表文章。

再比如合肥的 " 人造小太阳 ",它通过技术途径解决能源的问题。原来做模拟实验时,要把粒子加速到一定速度,产生聚变反应发出能量,达到一定高度可以留存 1000 秒。

原来做模拟实验需要 10-20 天,现在用 AI 帮它做一次实验只用一个小时,原来 10-20 天的实验成功率 93%,现在一个小时成功率 97%,极大提升了科研效率。

所以有人说今天如果科研不用新的人工智能工具,就是原来的农业水平阶段。

到工业阶段,会将大量优秀的、有创新能力的年轻人从简单、重复的科研活动中释放出来,就像我们原来做天体研究一样,如果发现一个新的行星,那导师招博士时不敢招太多人,因为那有很大的运气成分,你可能一辈子都没找到一个,那博士就毕业不了。

现在大模型可以把大海捞针变成茶壶里倒茶叶,利用人工智能可以加速现有科研从农业到工业阶段。

但这还是用现有的技术,加速科研方式,减少重复性的科研劳动,仍然属于人工智能的第二和第三阶段。

第四阶段就是创新,虽然我不清楚路径,但是我可以给很多新的关于科研的启发。这些科研是脑洞大开的,有可能都没有人做,很多时候是我们自己都没想到的。

目前我们正在与中国科学院大连物理化学所和中科院非常有名的院士合作,与他们做化工大模型,不仅将现有技术路线明确为相对清晰的科研方向,使研发效率大幅提升,同时帮助他们创造更多可能的创新方法。

最后一个阶段就是组织者,现在有一点小苗头,虽然不能完全替代人类,但是两个机器人协同工作,能够组织社会资源,开始组织协同性工作,更复杂地构建整个任务体系。

在这条发展的路上,大模型的天花板仍然被持续打开。所以 Anthropic 的 CEO 表示到 2026 年,有可能达到诺奖级。

从第二个阶段的智能者到第四个阶段的创新者,正在不断进步,这个进步并不需要依靠新的不可预知的算法或者脑机接口、类脑计算等,而是用预训练和强化学习两种方法。

强化学习是针对已有的学完的内容,在特定任务中自己相互 PK,有的是人参与,有的是完全依靠自己。例如 AlphaGo 下围棋,要学几千万张棋谱,后来自己与跟自己对弈,一周后就能击败所有世界冠军。

所以通过预训练和强化训练两种方法,大模型的自主进化在未来 2-3 年内还有巨大的提升空间,天花板非常之高。

科大讯飞坚持国产大模型

去年底有人说今天不用做底座大模型,而是要做行业落地。科大讯飞一直强调我们必须在底座模型上继续前进,因为它的空间潜力巨大。

在这个底座上,中国的基本架构相当清晰,大概头部就是几家公司。

现在最火出圈的是 DeepSeek,在工程化上有很多积累,他们专注做语言模型,而且开源,做的确实相当不错。讯飞主要是在语音、图片、视频、多模态上。

国内还有像豆包、腾讯元宝等也都做得很好。

但今天大模型落地实际上已经开始出现了不同的战略角度,有的专注于娱乐、电商、开源,有的专注于其他领域。

我们在 2023 年 5 月 6 日推出讯飞星火 1.0,我们的口号就是解放生产力,释放生产力,我们是 "1+N",底座模型必须自己掌控,才能不断地在上面做更好的强化训练,更好的升级,然后 "N" 是我们落地的。

我们现在与教育、医疗、司法、央国企、汽车、金融、能源等的落地都是行业第一。

去年我们央国企招标数比前年多了 15 个亿,招标金额多了 7.2 倍,我们是中标第一,超过第二名到第六名加起来的水平。

为什么?因为今天主流的全民可下载的通用大模型,除了星火以外,其他全是由英伟达的卡训练的。

2022 年美国规定中国的卡要限高限宽,所以美国人用 A100,中国只能用阉割后的 A800,结果 2023 年美国的政策更加严格,不光中国买不了,可能给中国做中间地带输送算力的四十几个国家业全被堵死了。特朗普上台以后,可能这些智算的训练卡全部会被限制。

芯片方面,原来我们可以使用 12 纳米、16 纳米的芯片,例如三星、台积电,生产完成后,可以利用芯片堆叠技术堆到 7 纳米以下的性能。

目前这条路从今年一二月份开始已经被堵死。

因此在这个背景下,中国是否有自主可控的国产算力支撑大模型训练非常关键。

大模型对算力最重要的两个地方,一是训练,二是推理。训练就像我们学习,学会后参加高考,参加博士考试,然后工作。学的过程中训练的难度极大,训练完成后对外提供服务的推理相对简单。

2023 年 10 月 24 日,我们在合肥建了中国首个万卡的国产算力,华为 910B,当时对标美国的算力只有百分之二十几的效率,人家三个月而我们要一年多,所以 2023 年一年我们在国产算力上发力,把它从对标美国 A800 做到 A100 的能力从百分之二十几提升到 90%。

我们去年 1 月 30 日推出中国首个用国产算力训练出来的千亿大模型,讯飞星火 3.5。

为什么大家都不愿意用国产卡?英伟达每一个新的工具出来,在国产上少则一周,多则需要一个半月做各种适配。

其实我们去年 10 月份就跑通了深度推理和长思维链的模式,但是在国产算力上整整花了两个月把各种工具匹配好,才能够进行训练。

2025 年 1 月 15 日,讯飞星火 X1 发布,是首个用国产算力训练出来的长思维链模型,但是 R1 是 671B,我们只有 13B,因为时间太短,国产算力刚刚把数据调完。

到了 3 月 3 日,我们用 70B 在数学上已经达到 R1 的效果,比它低一个数量级,数学跑通了,长思维链的逻辑就全通了。

但我想说的是这个事情在国产算力上要把它跑通,有特别多的坑。如果中国没有一家企业做,我们的大模型又会回到当年和英特尔 CPU 一样,龙芯出来了,可是谁都不用,中国芯就永远发展不起来。

因此在国产战略上,我们必须认真对待,无论多困难,耗费多大的算力,都必须坚定不移地继续前进。

企业如何拥抱 AI?

在当前的态势下,我认为大家应该特别关注底座大模型的快速发展。如果现在底座模型达到 70 分、80 分,那么两年后可能达到 80 分、90 分,甚至可能达到诺奖级别,在专业领域进行科研。

再到场景定制,在提升 5 到 10 个点,达到 95 分、100 分,到时候它就可以独立完成任务。

原本人机协同需要 1 万人完成,现在只要 100 人就能完成。

但是只靠通用大模型还不够,幻觉问题解决不了,最近有第三方机构测的,比如大家都知道的 DS,我觉得它提升了中国社会各阶层对自主创新的自信心。

但是拿 DS 作为例子来说,V3 的幻觉是百分之三点几,R1 是百分之十几,因为它用强化学习用的训练数据更少。所以必须要在大模型底座能力上结合专业行业数据,而且能够外挂企业自己的实时产生的各种数据和支持,才能把幻觉降到能用的门槛,否则没法使用。

所谓的第一眼惊艳到我们企业的研产供销服管产品落地,必须要做定制化。

今天的大模型在 C 端的用户数量春节前后已经达到 2.49 亿,已经跨越技术规模化应用的鸿沟。

早期创新者的占比为 2.5%,探索型早期尝鲜者占比是 13.5%,跨越 16% 后就可以进入规模化爆发阶段。

所以 2025 被称为全民 AI 的时代,成为全行业 AI 应用的拐点。

那么在这个时候,大家如果不让自己的企业和生意运行在大模型之上,大概率现在所有靠堆人力和时长的商业模式都会在一两年内被彻底颠覆掉。

关注这个变化不应该盲目地被焦虑感推动,而是要客观地分析自己的每一个业务环节,研产供销服务各个场景,认认真真地去构建平台,因为业界开源越来越多,有非常多的单点的整合的各种工具,大家可以去尝试。

现在底座模型 7 大方面已经有 1000 多个细分的维度,虽然应用场景我们自己的探索不如全行业在开源上做的多,但是科大讯飞今天必须是运行在 AI 之上的微软公司。

原来我们给央国企、金融与汽车这些行业龙头做方案,下一步我们要把这些能力开放给所有人使用,你不用自己建算力,直接租用服务就行。

甚至我们跟工业园区联合部署大模型,根据大模型成效合作分润。

所以我觉得我们第一,大家要关注这个业务,找到切入点。第二,我们正在与许多城市合作构建智算生态,例如成都、武汉、无锡、苏州和温州。

讯飞是唯一国产算力构建的自主可控大模型,未来中国的城市生态既服务于本地的创业,又服务于本地产业发展,他们都需要构建以算力和底座大模型算力支撑的产业生态。

如果大家利用算力,要借助这些生态,这些城市会发放优惠券并且打折,有公共平台吸引大家。我认为我们可以通过这方面拓展技术赋能和行业经验,共同站在 AI 的平台上共同发展。

谢谢大家。

好文推荐:

排版  | 椰子

编辑  | 允允   主编  | 孙允广

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

科大讯飞 ai 刘庆峰 合肥 人工智能
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论