
图片由 AI 生成
如果一个 AI 每次对话结束后,都会把与你的全部交流清空,那么无论它多聪明,都只能算是一个 " 高级聊天工具 ",而不是一个真正意义上的智能体(Agent)。
这正是当下 Agentic AI 面临的核心瓶颈之一:失忆。
近日,由盛大集团全资孵化的 AI 技术团队 EverMind,正式对外系统性地展示了他们给出的解法—— EverMemOS,最新版本在四大记忆基准上实现了最先进(SOTA)准确率。
伴随而来的,还有 EverMemOS 云服务的内测,以及一项总奖金高达 8 万美元的全球开发者大赛 —— Memory Genesis Competition 2026。
这背后是陈天桥对 " 基础性技术长期投入 " 的一贯判断,也是 EverMind 联合创始人邓亚峰在 AI 记忆基础设施方向上的一次正面下注。
在产品发布之外,这也更像是一次针对 "AI 是否能真正成为长期智能体 " 的底层挑战。
为什么 Agent 一定需要长期记忆?
在大模型能力突飞猛进的这两年里,行业几乎把所有注意力都集中在参数规模、多模态、推理能力和算力效率上。
但在真实应用中,开发者很快发现了一个残酷事实:模型会 " 忘事 "。
无论是对用户偏好的理解、对历史决策的追溯,还是跨时间跨度的复杂推理,只要上下文窗口结束,一切都得从头来过。RAG 可以缓解一部分问题,但它更像是 " 临时查资料 ",而不是 " 真正记住 "。
如果说大模型负责 " 思考 ",那么记忆系统决定的,其实是智能体是否具备连续自我。
邓亚峰认为," 如果模型每次会话后都会重置理解,真正的 Agentic AI 就无从谈起。"
EverMind 正在从静态的上下文窗口迈向动态、自组织的记忆,借助 EverMemOS,为智能体提供了一段 " 活的、会演化的历史 "。
基准结果表明:EverMind 能够以远低于全上下文模型的算力成本,实现更高的准确率。
正是在这一判断下,EverMind 把研发重心从模型能力本身,转向了一个更底层,也更难的方向—— AI Memory Infra。
EverMemOS:打破行业基准,点击即用
在 EverMind 最新发布的论文 EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning 中,团队对现有主流方案进行了清晰区分。

截图来源:EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning
EverMind 详细阐述了其技术提出的一套受 engram 启发的生命周期机制,用以模拟生物认知过程。与传统 RAG 或成本高昂的超长上下文窗口不同,EverMemOS 能将经验组织为连贯、可演化的结构。
它试图构建的,是一个类似生物认知系统的记忆生命周期,灵感直接来自神经科学中的 engram 理论。
在这套架构中,记忆不是静态存储,而是会被不断压缩、重组、强化和遗忘的动态系统。
EverMemOS 的核心机制,被概括为三个连续但可循环的阶段。
第一阶段:情景痕迹形成(Episodic Trace Formation)。
将对话流转换为 MemCells,用于捕捉情景痕迹、原子事实以及有时间边界的前瞻信息。
第二阶段:语义巩固(Semantic Consolidation)。
把 MemCells 动态组织为主题化的 MemScenes,提炼稳定的语义结构,并持续更新持久化的用户画像。
第三阶段:重建式回忆(Reconstructive Recollection)。
通过 agentic 检索组合 " 必要且充分 " 的推理上下文,在优化算力成本的同时保证高准确率。
这也是 EverMemOS 能在大幅降低 token 消耗的同时,维持甚至提升准确率的关键。
基准成绩,是硬指标
在 AI 基础设施领域,架构是否成立,最终要看基准测试。
EverMind 在四个主流记忆评测基准上,给出了极具说服力的数据。
LoCoMo(93.05% 准确率):超越全部现有记忆系统与全上下文模型;在多跳推理(+19.7%)与时序任务(+16.1%)上优势显著,同时大幅降低 token 使用与计算成本。
LongMemEval(83.00% 准确率):在知识更新与时序推理方面位居第一;其中知识更新任务提升 20.6%,体现出系统可通过持续语义巩固不断 " 进化 " 的能力。
HaluMem(90.04% 召回):在记忆完整性方面建立新的行业标准,显著减少长时程任务中的幻觉。
PersonaMem v2:在 9 个复杂场景中,在深度个性化与行为一致性维度取得最佳综合表现。
这说明 EverMind 不需要牺牲效率,去换取长期记忆。结构本身,就是效率。
从论文到云服务:记忆能力的产品化
如果 EverMemOS 只停留在论文阶段,它的意义仍然是学术层面的。
但是,EverMind 显然希望更快地进入真实应用场景。
此次同步推出的 EverMemOS Cloud Service,正是为开发者和企业提供 " 即插即用 " 的记忆增强能力。通过简单 API 调用,原本无状态的聊天机器人,可以在数分钟内升级为具备长期上下文感知的智能体。
在设计上,该云服务强调三点:
一是企业级数据安全与隐私隔离;
二是对底层记忆架构的自动迭代;
三是尽可能降低开发者的使用门槛。
目前,该服务已对候补名单(waitlist)用户开放内测,也可以通过官网申请加入内测:console.evermind.ai。
Memory Genesis:把基础设施交到生态手里
与产品发布同样重要的,是 EverMind 对生态的态度。
Memory Genesis Competition 2026,并不想做成一次常规的应用开发大赛,而是围绕 " 记忆原生应用 " 展开的系统性共创。

图片来源:EverMind
赛事设置了 Memory+Agent、Plugin 和 Infra 三大赛道,覆盖从应用到基础设施的不同层级。初始奖金池为 8 万美元,并提供后续收入分成与职业机会。
优秀开发者不仅能获得奖金,还可能直接进入 EverMind 工程团队,或获得长期技术支持。
开发者可在 2 月线上参赛并提交作品,3 月份将在社区逐步公布优秀项目,并将邀请优秀团队参加 4 月初在硅谷举办的线下活动。
开发者可在 evermind.ai/activities 注册。
Memory Genesis Competition 的举办,延续了陈天桥一贯的逻辑:真正的基础设施,必须交由生态来验证和放大。
从更大的时间尺度看,EverMemOS 的出现并不偶然。
当模型能力趋同、算力成本成为瓶颈,长期记忆正在成为 Agent 竞争的分水岭。谁能让 AI " 记得住、记得准、记得久 ",谁就更接近真正的智能体。
EverMind 选择在这个节点押注记忆基础设施,既是技术判断,也是战略选择。
对陈天桥和邓亚峰而言,这是一次对 " 长期价值 " 的再次下注,为 Agentic AI 补上一块关键拼图的尝试。
多数 AI 应用的失败,也许并不是因为模型不够聪明,而是因为系统不够完整。
EverMemOS 至少回答了一个长期被忽视的问题:如果 AI 没有记忆,它到底是谁?
而这,或许正是下一阶段智能竞争真正开始的地方。(作者|李程程,编辑|李玉鹏)


登录后才可以发布评论哦
打开小程序可以发布评论哦