钛媒体 App 4 月 2 日消息,北京中关村学院信息智能团队自主研发的智能体系统 Milkyway,在 FutureX 评测中以 60.9 分的成绩登顶全球榜首。FutureX 是专门考验 "AI 预言能力 " 的国际动态评测基准,由字节跳动、斯坦福、复旦、普林斯顿大学等顶尖学术机构联合发起,其数据集在 HuggingFace 上公开,通过尚未揭晓的真实事件(如地缘博弈、政策走向、经济波动)来考验 AI 的预测能力。
本期评测中,埃隆 · 马斯克公司旗下的 Grok4 得分为 25.9 分,Milkyway 的得分超出一倍有余。该团队由 "AI 核心 " 学部大模型方向的郑书新副教授带领,聚焦下一代 AI 核心能力的探索。这一突破不仅依靠模型本身,更得益于在智能体系统层(harness 层)的深度攻关,使系统具备跨长周期工作、多智能体协作及自我评估与迭代修正的能力。(广角观察)


登录后才可以发布评论哦
打开小程序可以发布评论哦