航通社 11-12
精准文生图,动嘴编程:百度世界2024发布重磅更新
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

11 月 12 日,在上海举办的百度世界 2024 大会上,李彦宏发布了检索增强的文生图技术(iRAG)和运用智能体协作实现的无代码工具 " 秒哒 " 等重要产品。

截至 11 月初,百度文心大模型的日均调用量已超过 15 亿次,相较于 5 月的 2 亿次增长了 7.5 倍,与一年前首次披露的 5000 万次相比,增长了约 30 倍。

幻觉问题是大模型广泛应用的主要限制之一,而检索增强(RAG)技术是解决这一问题的关键。目前,文字层面的 RAG 技术已经相当成熟,但在图像等多模态方面,RAG 技术的结合还不够充分,尤其是在生成特定地点、物品和人物的图像时,常常会出现错误匹配的问题。

百度文心 iRAG 技术旨在解决大模型在图像生成方面的幻觉问题,从而提高其实用性。iRAG 结合百度搜索的亿级图片资源和强大的基础模型能力,可以生成超真实的图片,去除机器味。李彦宏展示了一幅 " 大众揽巡汽车飞跃长城 " 和一幅 " 爱因斯坦环游世界 " 图片,作为例子。

在影视作品、漫画、绘本、海报制作等应用场景中,文心 iRAG 的商业价值体现在无幻觉、超真实、零成本和即时获取等方面,真正实现大幅降低创作成本的愿景。

" 秒哒 " 则旨在使每个人都能够拥有编程能力,进而创造数百万 " 超级有用 " 的应用。它是以智能体为基础的一个示例应用,具备无代码编程、多智能体协作和多工具调用三大特性,使用自然语言即可搭建一整套系统,这标志着一个 " 只靠想法就能赚钱的时代 " 的开启。

多智能体协作是基于文心大模型的思考和规划能力,实现对不同智能体的调度和编排;通过文心大模型可调用网页检索、iRAG、地图 API 等各类型工具。

演讲现场展示了活动报名系统的搭建过程:只要在 " 秒哒 " 上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥 " 小组长、策划、小编、程序员和质检员 " 五个智能体互相协作,完成报名系统的开发。

李彦宏认为智能体将成为 AI 应用的主流形态,并即将达到爆发点。他详细阐述了公司、角色、工具和行业四大类智能体,并类比 PC 时代的网站和移动时代的自媒体账号,强调智能体更接近人类,更智能,成为 AI 原生时代内容、信息和服务的新载体。

例如百度文库和百度网盘联合打造的工具类智能体 " 自由画布 ",允许用户在类似 " 画布 " 的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。法律智能体 " 法行宝 " 已回答用户 1660 万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配律师。

目前,文心智能体平台已吸引了 15 万家企业和 80 万名开发者。李彦宏展示了文心智能体平台的 TOP100 智能体和 TOP100 产业应用,称公司智能体可以根据顾客需求推荐相应产品,并在服务方面更直接、快速地响应需求,大幅提升互动营销的效率。比亚迪官方智能体上线后,销售转化率提升了 119%,联想 AIPC 智能体的 9 月互动率提升了 89%。

想跟作者进一步讨论本文,欢迎您加入航通社的读者交流群!请添加入群小助理个人号,微信搜索:hangtongshe ,附言写 "航通社读者进群"。    

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

百度 李彦宏 ai 编程 程序员
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论