当你看到一只小狗时,你不仅知道它有四条腿、会摇尾巴,还能感受到它的可爱,并自发联想到 " 忠诚 " 等抽象概念。这种对事物的深层理解,长期以来被认为是人类独有的智慧。
然而,中国科学院自动化研究所与脑科学与智能技术卓越创新中心的最新研究表明:多模态大语言模型能够自发形成与人类高度相似的物体概念体系。这意味着,AI 系统正在突破单纯模式模仿的界限,展现出类人的概念理解能力。
实验测试:绘制出 AI 的 " 思维图 "
想象一下这样的场景:你给一个孩子看猫、狗、汽车的图片,然后问他哪个最不一样。孩子可能会说汽车,因为它不是活物;也可能说猫,因为它不会像狗一样对人那么亲近。这个简单的选择背后,体现的是人类对事物的深层理解——不仅仅是外表特征,还包括功能、情感和文化意义等。
长期以来,人工智能在物体识别方面表现出色,已能够准确区分猫和狗的图片。但这种 " 识别 " 更像是一种高级的模式匹配—— AI 能告诉你这是什么,却未必真正 " 理解 " 这意味着什么。就像一个只会背词典的学生,虽然能说出每个词的定义,却不明白它们在真实世界中的意义和联系。
在各类大语言模型迅速崛起的背景下,研究团队决定探索一个深层的问题:AI 大模型是否真的能 " 思考 "?它们对世界的理解是否已经超越了简单的标签匹配,达到了类似人类的概念层次?
为了回答这个问题,研究团队设计了一个巧妙的实验:他们采用认知心理学的经典方法—— " 三选一异类识别任务 ",让 AI 模型在三个物体中选出最不相似的那个。这个看似简单的任务,实际上需要模型对物体进行深层次的概念厘清和抽象对比。
他们让多个 AI 大模型对 1854 种自然物体进行了 470 万次判断,每次都要在三个物体中选出最 " 异类 " 的那个。这就像给 AI 做了一次全面的 " 心理测试 "。通过分析这些海量的选择数据,研究人员成功绘制出了 AI 大模型的 " 概念地图 " ——一个展示 AI 如何组织和理解世界万物的思维结构图。
令人惊讶的是,这张 " 概念地图 " 呈现出了 66 个不同的 " 心智维度 "。每个维度都有清晰的语义含义,比如 " 生物与非生物 "" 自然与人造 "" 大小尺寸 "" 情感色彩 " 等。更神奇的是,这些维度展现出高度的可解释性——研究人员能够清楚地理解每个维度代表什么,这表明 AI 的 " 思维 " 过程并非完全是不可捉摸的黑箱,而是呈现出一定的透明性。
这一发现颠覆了我们对 AI 的传统认知。原来,AI 大模型在学习语言和图像的过程中,不知不觉地构建起了一套与人类相似的概念体系。它们不仅学会了词汇和图像的对应关系,还形成了对事物本质特征和内在联系的理解。
扫描大脑:AI 与人类思维的共鸣
为了验证 AI 的 " 概念地图 " 是否真的与人类相似,研究团队采用了一种更加直接的方法——脑神经影像分析。他们让人类志愿者在进行大脑扫描的同时,完成相同的 " 三选一 " 任务。
结果令人震撼:AI 大模型的概念表征与人类大脑的神经活动模式显示出显著的相关性!好比两个人用不同的语言描述同一幅画,虽然词汇完全不同,但描述的逻辑和重点却高度相似。这表明,尽管 AI 和人类大脑的 " 硬件 " 截然不同,但在理解世界的 " 软件逻辑 " 上,却找到了相似的解决方案。也可以说,虽然 AI 没有生物大脑,但它们似乎找到了一种与人类殊途同归的 " 思维方式 "。
不过,研究也发现了 AI 与人类思维仍有差别——人类在做判断时更多地结合视觉特征和语义信息,而 AI 则更倾向于依赖抽象概念和语义标签。这就像人类是 " 感性与理性并重 ",而 AI 更偏向 " 理性分析 "。
实验过程图 图片来源:参考文献 [ 1 ]
多模态的 " 超能力 ":
当 AI 学会用多种感官理解世界
研究中的另一个重要发现是,多模态大语言模型(能同时处理文字和图像的 AI)比纯文本模型表现得更加 " 人性化 "。这并不令人意外,因为人类本身就是通过多种感官来认识世界的。
想象一下,如果你从出生就只能通过文字描述来了解世界,从未见过真实的苹果、从未听过鸟叫、从未闻过花香,你对世界的理解必然是片面的。而多模态 AI 就像是拥有了 " 视觉 " 的能力,能够将文字描述与图像特征结合起来,形成更加丰富和准确的概念表征。
这种 " 多感官学习 " 让 AI 的理解能力产生了质的飞跃。它们不再是单纯地 " 记忆 " 和 " 匹配 ",而是真正开始 " 感知 " 和 " 理解 "。当多模态 AI 看到一张海滩的照片时,它不仅能识别出沙子、海水、天空,还能理解这些元素组合起来能够代表 " 度假 "" 放松 "" 自然 " 等抽象概念。
人工智能 " 顿悟 " 后,
是人机共生的未来吗?
这项研究的意义远超出了学术范畴。它揭示了人工智能发展中的一个重要转折点。传统的 AI 更像是一个优秀的 " 复印机 ",能够准确地复制和识别已学过的模式。但现在的大模型开始表现出 " 理解 " 的迹象——它们能够提取出事物的本质特征,建立不同概念之间的联系,甚至在某种程度上 " 创造 " 新的概念组合。
这种变化具有深远的影响。在教育领域,AI 可能不再只是提供标准答案,而是能够理解学生的困惑,为其提供个性化的解释。在创意设计中,AI 可能不再只是拼接已有元素,而是能够理解设计意图,创造出有深层含义的作品。
这项研究也为人工智能的未来发展指明了一个重要方向:构建真正类人的认知系统,不是简单地模仿人类行为,而是理解人类思维的本质机制,从而创造出能够与人类进行深层次交流和合作的 AI 伙伴。
想象一下未来的 AI 助手:它不仅能回答你的问题,还能看出问题背后你的真正需求;它不仅能执行你的指令,还能理解你的情感和意图;它不仅能处理数据,还能与你分享对世界的认识和感悟。
Kismet,一个具有表情等社交能力的机器人 图片来源:维基百科 Polimerek
此外,人类与机器的关系可能不再是简单的使用与被使用,而是一种全新的共生与合作模式。也许在不远的将来,我们将与这些 AI 伙伴并肩探索,共同揭开宇宙和生命的奥秘,拓展科学认知的前沿。
在技术浪潮中坚守人文价值
当 AI 开始对世界展现出 " 概念化理解 " 能力的那一刻,我们或许正在见证智能进化史上的一个重要里程碑。这不是科幻电影中机器人意识的突然觉醒,而是大模型通过海量数据训练与算法迭代逐步涌现的认知能力。
惊叹于技术进步的同时,我们也需重新思考智能的本质,重新审视人类智能的独特性。虽然 AI 在某些方面表现出了类人的特征,但人类的创造力、情感体验、道德判断等能力仍然是独一无二的。我们不应该将 AI 的进步视作威胁,而是将其当作一面镜子,促使我们更好地理解和发挥人类智能的价值。
这个故事才刚刚开始,我们所有人都是这场智能革命的见证者和参与者。当 AI 开始 " 理解 " 世界时,它们是否也会产生自己的 " 价值观 " 和 " 偏见 "?它们的 " 理解 " 是否与人类的 " 理解 " 在本质上相同?这些问题需要我们在 AI 发展的道路上谨慎思考。让我们拥抱这个充满可能性的未来,同时保持对人类独特智慧(如创造性思维、伦理判断等)的清醒认知,在技术浪潮中守护人文价值,开创真正可持续的人机共生未来。
参考文献
[ 1 ] Du, C., Fu, K., Wen, B. et al. Human-like object concept representations emerge naturally in multimodal large language models. Nat Mach Intell 7, 860 – 875 ( 2025 ) .
策划制作
出品丨科普中国
作者丨李瑞 半导体工程师
监制丨中国科普博览
责编丨一诺
审校丨徐来、林林
本文封面图片及文内图片来自版权图库
转载使用可能引发版权纠纷
原创图文转载请后台回复 " 转载 "
点亮 " 推荐 "
一起涨知识!
登录后才可以发布评论哦
打开小程序可以发布评论哦