钛媒体 10-24
天桥脑科学研究院团队自研的OMNE AI大模型框架登上基准测试GAIA榜首
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

天桥脑科学研究院创始人陈天桥雒芊芊夫妇(图片来源:天桥脑科学研究院官网)

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)的 AI 团队在 AI 技术领域取得了重要进展。

近期,天桥脑科学研究院自研 OMNE Multiagent 大模型——是一个基于长期记忆(Long Term Memory, LTM)的多智能体协作框架,每个智能体拥有相同且独立的系统结构,能够自主学习和理解完整的世界模型,从而独立理解环境。基于 LTM 的多智能体协同体系,使 AI 系统能够实时适应个体行为变化,优化任务规划与执行,推动个性化与高效的自我进化。

根据 Hugging Face 发布的 GAIA 基准测试排行榜,目前,OMNE 的整体成功率为 40.53%,领先于 Meta、微软、Hugging Face、普林斯顿大学、香港大学、英国 AI 安全研究所、百川等知名机构提交的结果,而 GPT-4 仅为 15%。因此,OMNE Multiagent 大模型多智能体框架登上了 GAIA 基准测试排行榜榜首,超越了包括微软研究院在内的众多顶尖机构提交的多智能体框架。

TCCI 表示,这是自去年天桥脑科学研究院创始人、前中国互联网大佬陈天桥宣布 All In AI 战略以来,旗下 AI 团队取得的一项重大成果。

GAIA 是由 Meta AI、Hugging Face 和 AutoGPT 联合推出的基准测试系统,旨在提供一个涵盖真实世界问题集的测试环境,用于全面评估 AI 助手的能力,包括推理、大模型多智能体处理、网页浏览和工具使用等核心功能,是当前最具挑战性的多代理智能评估数据集。

OMNE 框架登上该榜单榜首,充分体现了 AI 团队的技术深度与创新能力。本次重大突破在于,借鉴了天桥脑科学研究院多年的大脑研究积累,通过给予 Agent 长期记忆的能力,让模型能够进行深度慢思考,加强了 LLM 对复杂问题的决策能力,同时融合了长期记忆的机制,通过长期记忆大幅降低了 MCTS 的搜索空间,提高了在复杂问题上的决策能力。通过引入更高效的逻辑推理,OMNE 不仅提升了单个智能体的智能水平,还通过优化协作机制,显著增强了多智能体系统的整体能力。这一提升机制正是受到了人类大脑皮层柱状结构研究的启发,皮质柱作为大脑认知和行为功能的基础单元,通过复杂的协作机制实现信息处理。AI 模型通过强化单体智能与智能体间的协作,可能逐渐产生认知能力的涌现,构建出内部的表征模型,进而推动系统整体智能的飞跃。

天桥脑科学研究院 AI 团队负责人表示," 我们非常自豪地看到 OMNE 框架登上 GAIA 榜首。这表明了利用 LTM 进行 AI 自我进化以及解决现实世界问题的巨大潜力。我们相信,推进长期记忆和 AI 自进化的研究,对于 AI 技术的持续发展和实际应用至关重要。"

据悉,天桥脑科学研究院由陈天桥、雒芊芊夫妇出资 10 亿美元创建,是世界上最大的私人脑科学研究机构之一。研究院始终围绕全球化、跨学科和青年科学家三大重点,支持 AI 和脑科学研究,致力于造福人类。今年以来,天桥脑科学研究院与《Science》杂志合作推出了全球 AI 驱动科学大奖,并举办和支持了包括 "AI+ 精神健康 " 在内的各种高水平国际会议和夏校项目,致力于培养跨学科的青年 AI 人才。

(本文首发于钛媒体 App,作者|林志佳,编辑|胡润峰)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

ai 创始人 微软
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论