陈天桥邓亚峰联手破解大模型记忆难题！4个月打造SOTA系统，悬赏8万美元发起全球记忆挑战赛

开年，DeepSeek 论文火遍全网，内容聚焦大模型记忆。

无独有偶，谷歌近期也发布了一篇被誉为 "Attention is all you need"V2（Nested Learning: The Illusion of Deep Learning Architectures）的重磅论文，核心同样指向记忆瓶颈。

就连最近这只彻底破圈的 AI 大龙虾—— OpenClaw（原名 Clawdbot），其亮点之一依旧是记忆。

也就是说，记忆≈今年全球 AI 圈集体押注的技术风口≈皇冠明珠。

几乎所有你能想到的大模型团队，都在加班加点往自家模型里塞记忆功能……

但这一次，让我们把视线从这些科技巨头身上稍稍挪开，就会发现有一支后起之秀同样不容小觑。

他们就是陈天桥和邓亚峰带队的EverMind。

为什么这样说呢？

且看产品，最新发布世界级长期记忆系统——EverMemOS，发布即 SOTA。

一举打破多项记忆基准测试的同时，还能远超此前所有的基线方法。

其次，它是真正能用的。

不是只会跑测试的 " 花架子 "，实际部署后效果照样能打。而且团队有底气有信心，技术代码全部开源。

为了方便开发者使用，他们刚刚还专门上线了云服务——现在只需一个最简单的 API，就能直接将最前沿的大模型记忆能力装进自己的应用。

并且要知道，从 EverMemOS 正式立项到开源，团队只用了短短四个月时间，这是什么实力不必多说。

不止如此，EverMind 更是联手 OpenAI 等十多个技术社区豪掷英雄帖，发起首届记忆起源大赛（Memory Genesis Competition 2026），号召全球顶尖人才前来共同书写记忆元年。

（突然燃起来了有木有！）

Anyway，下面我们娓娓道来。

大模型的记忆断裂 GAP

在展开聊聊 EverMemOS 为啥强之前，我们不妨先来思考一个问题：当你使用大模型时，是不是总觉得有什么地方不得劲？

前一秒还聊得好好的，下一秒就忘得一干二净，要么就是拆东墙补西墙，这个记住了，另一个又忘了。

归根结底，不是模型能力不够强，而是记忆功能不够用。

这就要回到大模型的底层架构上讲，众所周知，当前大模型普遍用的是Transformer架构，其记忆核心在于自注意力机制，也就是上下文窗口的信息缓存。

它会通过计算当前窗口的 token 间关系，理解上下文含义，但实际运行中由于受限于物理内存资源，窗口长度是有限的，一旦文本长度超过窗口限制，信息就会被截断遗忘。

另外，随着对话变长，KV Cache 占用的显存也会逐渐膨胀。影响推理效率的同时，为了节省资源，现有的技术往往会选择压缩旧记忆，从而导致记忆细节变得模糊。

这显然影响了用户的实际体验，举个例子 be like：

当你需要AI 协助写一篇论文时，从确定选题→检索相关文献→拟结构→写初稿→修改优化到最后定稿，这当中势必需要多轮交互，但 AI 压根记不住你之前写的内容，最后输出的结果也只能是驴头不对马嘴。

那怎么办呢？学术界为此提出了三种技术方案：

基于外部存储的记忆（External Storage based Memory）

这就类似于为大模型配备了一个外部数据库，里面系统存储着用户相关的历史记录。当用户提问时，系统就会先去数据库里搜索相关文档，再将其和问题一起喂给 AI。

但这并非真正的记忆，而是在考场上临时翻阅教材。

基于模型参数的记忆（Model Parameter based Memory）

该方案本质是将记忆通过训练内化成模型的一部分，通过微调 SFT 或持续预训练，让模型在看到某个问题时，就能迅速通过参数内部权重指向正确答案。

DeepSeek 的最新成果便是用的这个思路，但再训练的成本极高且容易遗忘，不适合个性化和短期记忆。

基于隐状态的记忆（Latent State based Memory）

通过保存模型的中间推理状态（如 KV Cache），达成类人的短期记忆或工作记忆。

它非常适用于理解复杂的对话语境，但换言之，它是一次性的，只能短暂存在，无法长久记忆。

其中业界用的比较多的方法，还是RAG（检索增强生成），也就是基于外部存储的记忆。

但 RAG 同样缺点明显。首先，其工作方式是将长文本切成一个个片段，会破坏信息的连贯性，让模型难以理解复杂的因果关系。

其次 RAG 依赖向量相似度检索，擅长找语义相近的内容，但在时序匹配上不足；另外 RAG 知识是相对静态的，如果要更新信息，则需要高昂的成本支持。

基于此，EverMemOS应运而生。

学习大脑记忆机制，成了

启发于脑科学技术的研究成果，盛大一直以来非常重视长期记忆领域的研究。早在 2024 年 10 月，盛大团队就对外发布了长期记忆领域的纲领性文章《Long Term Memory-The Foundation of AI Self-Evolution》。

基于盛大多个团队在该领域的持续积累，EverMind 在 2025 年 8 月正式启动 EverMemOS 项目，并于 11 月对外正式发布开源版本。

EverMemOS 是 EverMind 打造的首款 AI 记忆基础设施，对比同赛道团队，似乎姗姗来迟。

Mem0、Zep 等产品最早都能追溯到 2024 年，现在商业化最成功的开发者框架 Letta（原 MemGPT）也是 2023 年就开始起步。

EverMemOS 却交出了亮眼的答卷：最晚入场，但效果弯道超车。

从技术角度看，它同时继承了基于外部存储和基于隐状态两种路径。不过业内并非没有尝试过此类方案，但 EverMind 显然在记忆提取的精准度和逻辑一致性上实现了更优的平衡。

原因在于 EverMind 抓住了精髓，用邓亚峰的话说，就是：

通过 EverMemOS，我们赋予智能体一个活的、不断演化的历史。

这里的关键词其实是 " 活的 "。那么如何能保存最鲜活的记忆呢？人类大脑。

这就引出了 EverMind 的独特思路——生物启发。

具体来讲，EverMemOS 通过模拟人类记忆的形成并转化为计算框架，利用三阶段层层递进以实现大模型长期记忆的存储和提取：

Step 1：情景轨迹构建。

对应人脑的海马体和内嗅皮层，可以将连续的对话内容拆分成一个个独立的记忆单元（MemCell），每个单元里不仅记录有完整的聊天内容，还包括一些关键事实、时效信息等。

Step 2：语义整合。

类比新皮层（前额叶皮层 + 颞叶皮层），系统会将内容相关的记忆单元归类在一起，形成主题化的记忆场景（MemScene），同时还会更新用户画像，区分用户的长期稳定偏好和短期临时状态。

Step 3：重构式回忆。

这一步对应的是前额叶皮层和海马体的协同机制，当用户提问时，系统就会在记忆场景的引导下进行智能检索，只挑选出必要且足够的记忆内容，用于后续的推理任务。

由此，AI 学会像人类一样记忆——这不仅是知识的数据库存储，更是认知系统的深度整合。如此一来，即便是在多个 Agent 之间，也能实现信息的高效传递。

至于效果如何，咱们还是眼见为实，看看基准测试结果。

团队选取了 4 个主流记忆基准测试，以及多种大模型记忆增强方法。所有方法都基于同一基础大模型（GPT-4o-mini 或 GPT-4.1-mini）进行测试。

结果也很明显，EverMemOS 大获全胜，全面超越现有记忆系统和全上下文模型。

其中在LoCoMo上，准确率直接一跃来到 93.05%，尤其是在多跳推理和时序任务上表现突出，分别提升 19.7% 和 16.1%，同时 token 使用量和计算成本得到大幅度降低。

在多会话对话评估LongMemEval里，EverMemOS 同样以 83% 的准确率位居榜首，说明在面对跨度极大、信息量极高的场景中，EverMemOS 依旧能够精准检索和关联到过去的信息，并且通过持续交流还会不断进化完善自己。

HaluMem由 MemTensor 和中国电信研究院联合发布，是业界首个面向 AI 记忆系统的操作级幻觉评估基准。而 EverMemOS 在保证记忆完整性的同时，也显著改善了幻觉现象。

在PersonaMem v2里，EverMemOS 在九个复杂场景中依旧全场最佳，保证了深度个性化和行为一致性。

足以见得，EverMemOS 是相当全能的一枚选手，记性好、搜得准，关键还运行速度快、成本还够低，最长可突破百兆上下文限制。

一边帮大模型减负，一边帮大模型补记忆力，堪称大模型版安神补脑液（bushi）

不仅云，还要赢

诚然，技术扎实是一回事，能不能让开发者用起来则是另外一回事。

EverMind 觉得，开源还不够，直接上云服务。

省去中间繁杂的基础设施搭建，从开发者到 EverMemOS，只需要完成简单的两行 API 代码调用，就能实现多项记忆操作，包括：

记忆摄入：从消息和交互中提取和存储记忆；

记忆检索：使用筛选选项（例如按元数据字段）检索已存储的记忆；

记忆搜索：利用关键字驱动的混合检索方式搜索记忆；

对话元数据：设置或更新对话元数据以改进提取和检索行为。

有两种使用 EverMemOS 的方式，EverMemOS Cloud和开源版本。前者使用托管 API，更方便也更快，且核心引擎会自动更新到最新版本，后者则由用户自己运维。

开源版本需要自行准备部署环境：

云服务上手更快，功能简洁，探索空间却很大：配置记忆空间→获取 API 密钥→保存记忆→使用记忆，即可轻松体验当前业界性能 SOTA 的 Memory 系统。

△选择 EverMemOS 云服务或开源版本的理由

目前云服务已经正式开放内测申请，填写正确的邮箱地址后即可享受免费服务。（申请入口：https://console.evermind.ai/）

不过正如邓亚峰所说，要想掌握 AI，多学不如多用。在部署好 EverMemOS 后，不妨来参加 EverMind 举办的记忆起源大赛。

EverMind 把舞台也给大家一站式搭好了～

比赛将从 1 月一直持续到 4 月，现已面向全球开发者开放注册通道和云平台，需要注意要在2 月底之前完成项目提交。具体将分为三大赛道：

1、记忆 + 智能体：

要求构建具备长期、进化能力的智能体，例如个人数字孪生、内容创作者工作流程、销售 /CRM 协作助手、医疗保健 / 治疗智能体、教育伙伴、多智能体协作等。将选出 5 名获奖者，每人奖励 5000 美元。

2、平台插件：

基于 VSCode、Chrome、Slack、Discord、Notion、Obsidian 或 LangChain 等框架或 SDK 为 EverMemOS 建立扩展操作系统生态。将选出 7 名获奖者，每人奖励 3000 美元。

3、操作系统基础设施：

帮助优化 EverMemOS 的核心，例如核心功能修改、性能调优、架构改进等。将选出 3 名获奖者，每人奖励 3000 美元。

另外还将根据总成绩结合线下活动表现，选出额外的总冠军（额外 1 万美元）、人气开发者（额外 5000 美元）和 2 个 Aha 案例（额外 3000 美元）。

总奖金池高达 8 万美元，另外每位获奖者还将拥有收益分成机会和社区头衔。其中顶级贡献者还可有机会获得全职 offer，以及受邀加入 EverMind 担任技术顾问。

所有参赛选手都将接受来自 EverMind 工程团队的直接导师指导，更多比赛细节可见赛事官网。（https://evermind.ai/activities）

连接智能的关键在记忆

那么最后，我们再来看看 EverMind 究竟意欲何为？毕竟又是发新技术、新平台，又是办比赛，这一套组合拳下来，野心可不小。

首先从供给侧讲，EverMind 正在试图用 EverMemOS 重新定义大模型记忆的技术路线。

EverMemOS 没有沿着原来已有的技术方案延展，而是实打实地摸索出了一条以脑科学 +AI的独特路径，而且它的技术成熟度出乎意料地扎实，说明 EverMemOS 还只是 EverMind 布局的冰山一角。

事实上，据 EverMind 透露，他们已经开始构造一整套的混合解决方案，其中底层是信息处理模块，上层则是在强化学习的驱动下，通过调用模型参数来实现对信息的使用。

当初做 EverMemOS 的时候，直接挑战最难的多对多协作场景，而非基础的 1v1 人机对话场景，就是因为他们把目光放在了更长远的标准重塑上。

△用 EverMemOS，让 Agent 拥有记忆

其次从需求侧讲，举办比赛一方面是为了扩大团队的影响力，将技术推广出去，让行业得以复用，另一方面也是为了通过秀肌肉吸纳更多相关领域人才，然后反哺 EverMind 的全链路技术研发。

这一点，从赛道设计中便可看出。三个赛道依次代表应用层、中间层、基础设施，覆盖到了用户所有的开发环节，凸显出 EverMind 对可循环应用生态的核心考量。

其实 EverMind 从一开始就定位明确。它并不满足于成为一个 RAG 工具或向量数据库，而是志在于做通向下一代人工智能的基础设施，即长期记忆系统（Long Term Memory OS），赋予 AI 个性化、主动性，以及通过持续学习（Continual Learning）自我演化（Self Evolving）的能力。

EverMind 希望能够成为大模型记忆的书写者，去亲自定义记忆是如何被创建、组织、检索和演化的。

而往更大的视角看，EverMind 的野心也折射出了一个行业共识——

智能来到比拼长期记忆的下半场。

人类智能主要由因果推理和长期记忆能力构成，如果说 OpenAI-o1、DeepSeek-R1 为 AI 带来了推理能力，那么长期记忆必然是下一代 AI 应该拥有的核心能力。

它将突破大模型的上下文局限，帮助 Agent 具备个性化特性，并持续进化出深层次的长期认知，这都是下一代 AI 必须有的特性。在模型能力日益同质化的背景下，哪家 Agent 能率先搭载高性能记忆系统，就意味着哪家能够真正拉开差距，拥有留住用户的护城河。

当然要实现这一点，不可能只靠一个团队单打独斗，而需要一整个生态协同发展，那么谁能成为这个生态的缔造者，就显得格外重要。

从某种程度讲，这恰恰是盛大的舒适区。

在互联网时代，盛大就靠着平台生态证明了自己的能力边界，而在如今新一轮 AI 时代里，盛大依旧能将过去的战略经验迁移过来，只是这一次它选择的是记忆。

所以毋庸置疑，由盛大孵化的 EverMind 将成为这个领域里不可忽视的一抹力量，它的野心与实力堪配。

此行必然不易，但我们或许已然可以期待，在不久后的将来，有更多如同 EverMind 的探路者携手共进，来真正揭开 AI 长期记忆迷宫的一角。

赛事报名：https://evermind.ai/activities

云服务入口：https://console.evermind.ai/

论文链接：https://arxiv.org/abs/2601.02163

代码仓库：https://github.com/EverMind-AI/EverMemOS

官网地址：https://evermind.ai/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

点亮星标

科技前沿进展每日见

宙世代

一起剪

相关标签