紫金财经 04-25
百度发布两大模型 王海峰:性能提升,具备更先进思维链
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

百度首席技术官王海峰紫金财经 4 月 25 日消息 Create2025 百度 AI 开发者大会在武汉举办。百度创始人李彦宏发布了文心大模型 4.5 Turbo 及深度思考模型 X1 Turbo 两大模型,以及多款 AI 应用。百度首席技术官王海峰现场详细解读了背后的技术。

两大模型连发,核心技术详解

王海峰介绍,文心大模型 4.5 是多模态基础大模型,文心 4.5 Turbo 源自文心 4.5,效果更好、成本更低;基于文心 4.5 Turbo,文心 X1 升级到 X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。在 C-Eval、CMMLU、MathVista、Math500 等多个基准测试集中,文心 4.5 Turbo 和 X1 Turbo 跟 DeepSeeK 与 GPT 模型相比,效果在伯仲之间。

大会现场,王海峰从基础模型、后训练、深度思考和数据等方面解读了文心 4.5 Turbo 和 X1 Turbo 的关键技术。

文心 4.5 和 4.5 Turbo 都是多模态大模型,实现了文本、图像和视频的混合训练。针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近 2 倍,多模态理解效果提升超过 30%。

后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了 " 训练 - 生成 - 反馈 - 增强 " 的模型迭代闭环,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

在训练阶段,研制了融合偏好学习的强化学习技术,通过多元统一奖励机制,提升了对结果质量判别的准确率,通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。得益于偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力全面提升。

深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

数据方面,打造了 " 数据挖掘与合成 - 数据分析与评估 - 模型能力反馈 " 的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。

文心快码发布 3.5 版本,累计服务 760 万开发者

基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。代码智能体,基于智能体的理解、规划、反思,以及工具调用能力,用自然语言对话,即可实现应用的自动开发,并支持多轮交互,迭代优化代码质量,实现了无代码编程,让人人都可以成为程序员。

智能代码助手,帮助专业的程序员更高效地写出更好的代码。据介绍,文心快码 3.5 版主要突破了四大核心能力:一是代码智能体引擎,支持多模态编程、开发工具调用、应用预览,实现「需求 - 编码 - 调试 - 验证」端到端生成;二是代码预测改写引擎,新增光标预测与多行智能改写,可精准实现复杂的代码的增加、删除和修改;三是上下文引擎,结合文心 4.5 和 X1 的推理能力,更懂开发者意图,回答问题更准确;最后是更开放的研发生态,通过 MCP 接入协议,全面兼容主流开发工具链。目前百度每天新增的代码中,文心快码生成的代码占比已超过 40%。最新数据显示,文心快码向全社会开放,累计服务 760 万开发者。

飞桨文心联合优化,开发者已达 2185 万

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。比如,训练方面,多模态统一的掩码注意力加速,在不同模态混合计算注意力时,显著降低掩码构建和计算开销,大幅提升训练性能;推理方面,多模态流式分块预填充机制,减少首 token 耗时,同时减少推理计算的显存峰值,提升推理批次大小,提升吞吐性能。通过这些联合优化技术,文心 4.5 Turbo 训练吞吐达到文心 4.5 的 5.4 倍,推理吞吐达到 8 倍。

从现场我们了解到,飞桨框架 3.0 既延续了动静统一、训推一体的技术特色,更在自动并行、神经网络编译器、高阶自动微分等方面创新突破。例如,动静统一自动并行,使得大模型分布式训练代码减少 80%;大模型训推一体,帮助强化学习训练提速 114%;科学计算高阶微分,微分方程求解速度比 PyTorch 快 115%;神经网络编译器,提升框架通用性能,模型端到端训练速度提升 27%;异构多芯适配,飞桨已适配国内外 60 多个系列芯片。

截至目前,飞桨文心开发者数量已超过 2185 万,服务超过 67 万家企业,创建的模型达到 110 万。

大模型让文博知识触手可及,首个 " 非遗武术大模型 " 发布

随着人工智能技术加速进步,大模型在千行百业的应用也越来越深入。例如,在文博领域,百度与中国文物交流中心达成深度合作,增强大模型在文博领域专业知识,并发布首个文博智能体,用 AI 的力量让文博知识触手可及,让每个人都成为文博传承的参与者与受益者;在非遗武术传承领域,百度与上海体育大学武术学院、中国武术博物馆馆联合发布 " 非遗武术 - 百度文心大模型 ",基于文心大模型,融合上海体育大学武术学院、中国武术博物馆的专业积淀,将武术技法与算法结合,通过 3D 动作建模、AI 动态纠错等技术,将非遗武术技术动作以数字化的形式保存和记录下来。

活动最后,第十二届百度奖学金颁奖典礼在现场举办。作为国内外 AI 领域资助金额与含金量最高的学术奖学金之一,百度奖学金自 2013 年设立以来,已累计发放超千万元资金。王海峰为来自全球顶尖高校的 10 位获奖选手颁发奖学金,每人 20 万元。这不仅是对获奖选手学术成果的认可,也彰显了百度对 AI 人才培养的长期承诺。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

百度 效果 分辨率 数据分析 创始人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论