为什么 Agent 需要记忆?

news2026/3/13 17:37:12
LLM 的上下文窗口是其唯一的「工作记忆」。对于短对话来说这不成问题但当工作流跨越数天、涉及多个会话、或需要追踪用户长期偏好时上下文窗口就成了瓶颈。即便上下文窗口扩展到百万 token 量级研究表明模型对超长上下文的利用效率仍然不佳且推理成本随 token 数量急剧增长。Agent Memory 解决的核心问题包括跨会话的上下文保持、从历史经验中学习与适应、长程任务的连续性维护、以及基于历史模式的预测性行为。正如 ICLR 2026 MemAgents Workshop 提案所指出的限制智能体能力的瓶颈越来越不是模型本身的推理能力而是记忆——Agent 如何编码、保留、检索和整合经验。记忆的分类体系「形式-功能-动态」统一框架2025 年 12 月发布的综述《Memory in the Age of AI Agents》Yuyang Hu 等47 位作者合著提出了一个系统性的分类框架获 Hugging Face Daily Paper #1截至 2026 年 1 月底在 GitHub 上积累了 1k stars。从形式Form看Agent Memory 有三种主要实现方式Token 级记忆以显式文本单元存储透明度高、可编辑。从平面日志到图结构再到多层层级体系复杂度递进。图结构因其对关联和时间动态的建模能力而在二维记忆中占主导地位。参数级记忆通过微调或参数更新将知识内化到模型权重中泛化能力强但面临灾难性遗忘风险。潜在记忆Latent Memory以潜在向量序列存在于模型推理流中追求性能和扩展性的平衡——这也是 2025 年下半年兴起的新范式。从功能Function看划分为事实记忆客观知识和规则、经验记忆具体事件和案例和工作记忆即时决策所需信息。从动态Dynamics看分析记忆的形成、演化和检索——何时写入、如何更新淘汰、如何高效召回。这个三维框架成为后续研究的共同参照坐标。「存储-反思-经验」演化框架2026 年 1 月另一篇综述《From Storage to Experience》提出了互补的演化视角将记忆机制的发展归纳为三个阶段轨迹保存Storage、轨迹精炼Reflection和轨迹抽象Experience揭示了从被动存储向主动知识建构的演进趋势。2025 年下半年的关键工作A-MEM基于 Zettelkasten 的智能体记忆NeurIPS 2025A-MEMWujiang Xu 等Rutgers University是 2025 年最具影响力的 Agent Memory 研究之一。其核心洞察在于传统记忆系统要求开发者预定义存储结构和访问模式这严重限制了跨任务的适应性。A-MEM 借鉴了 Zettelkasten卡片盒笔记法让 Agent 自主构建互联知识网络。每条新记忆被生成为包含上下文描述、关键词和标签等结构化属性的笔记系统随后在语义相似的笔记间建立链接。关键创新在于记忆演化——新记忆的加入会触发对已有记忆属性的更新使整个记忆网络持续精炼。在六个基础模型上的实验表明A-MEM 显著超越此前最优基线。论文被 NeurIPS 2025 接收已开源MIT 许可证。Zep 与 Graphiti时序知识图谱驱动的记忆层2025 年 1 月发布持续演进Zep 从企业级生产系统视角出发基于时序感知知识图谱构建记忆方案。其核心引擎 Graphiti 动态整合非结构化对话数据和结构化业务数据同时维护事实和关系的历史时间线。架构采用三层层级情景子图存储原始输入语义实体子图提取实体和关系社区子图生成高层领域摘要。双时态模型同时追踪事件发生时间和数据摄入时间支持精确的时间点查询和历史状态重建。在 Deep Memory Retrieval 基准上Zep 达到 94.8% 准确率vs. MemGPT 的 93.4%在 LongMemEval 上准确率提升高达 18.5%延迟降低 90%。Graphiti 已开源并提供 MCP Server 接口于 2025 年持续迭代。MemoryOS借鉴操作系统的分层记忆架构EMNLP 2025 OralMemoryOSKang 等北京邮电大学将操作系统的内存管理思想引入 Agent 记忆。三级存储体系——短期记忆、中期记忆、长期个人记忆——搭配存储、更新、检索和生成四个核心模块。短期到中期的更新遵循对话链 FIFO 原则中期到长期采用分段页面组织策略。在 LoCoMo 基准上F1 和 BLEU-1 指标分别提升约 49% 和 46%。论文被 EMNLP 2025 Oral 接收并于 2025 年 6 月开源 MCP Server 实现即插即用集成。Mem0面向生产的通用记忆层Mem0 定位为 AI Agent 的通用记忆层2025 年 4 月论文发布。通过语义提取和图数据库结合提供可扩展的长期记忆。支持按用户、会话和 Agent 维度组织记忆API 简洁强调生产就绪性。开源版本Apache 2.0在 GitHub 上获得广泛关注成为 Agent Memory 领域事实上的工程标准之一。MemGen生成式潜在记忆2025 年 9 月MemGenGuibin Zhang 等提出了全新范式——不再将记忆外挂于检索数据库而是让 Agent 在推理过程中直接生成潜在记忆 token。记忆触发器判断何时需要回忆记忆编织器根据当前状态构建潜在 token 序列形成记忆与认知的紧密交织循环。在八个基准上超越 ExpeL 和 AWM 等外部记忆系统高达 38%超越 GRPO 等参数优化方法高达 13%。更引人注目的是MemGen 在没有显式监督的情况下自发演化出了规划记忆、程序性记忆和工作记忆等类人记忆功能。MemEvolve记忆系统的元进化2025 年 12 月MemEvolve 提出了「元进化」概念——让 Agent 不仅使用记忆还能自动优化记忆系统本身的结构和策略。这标志着研究从「设计记忆系统」转向「让系统自行设计记忆」。MemOSMemTensor面向 LLM 的记忆操作系统MemTensor 团队的 MemOS 在 2025 年 7 月发布是最早提出「LLM 记忆操作系统」概念的工作之一。2025 年 12 月的 v2.0星尘版加入了多模态记忆图像和图表、工具记忆、知识库跨项目共享等功能进一步拓展了记忆的边界。2026 年的重要突破2026 年 1 月成为 Agent Memory 研究的又一个密集爆发期涌现出一批刷新基准的工作。MAGMA多图记忆架构2026 年 1 月MAGMADongming Jiang 等UT Dallas University of Florida指出了现有系统的一个根本问题绝大多数方法将记忆存储在单一的向量数据库中依赖语义相似度检索将时间、因果和实体信息混杂在一起。MAGMA 的解决方案是将每条记忆同时表示在四个正交的关系图上——语义图、时间图、因果图和实体图——并将检索重新定义为策略引导的图遍历。这种将记忆表示与检索逻辑解耦的设计提供了透明的推理路径和细粒度的检索控制。在写入端MAGMA 采用双流机制快路径负责非阻塞的事件分割、向量索引和时间骨干更新保证 Agent 响应性慢路径在后台异步推理潜在连接构建高价值的因果和实体链接。实验结果令人瞩目在 LoCoMo 上达到 0.7 的整体评分超越基线 18.6%–45.5%在 LongMemEval 上达到 61.2% 平均准确率。查询延迟仅 1.47 秒token 消耗降低 95%。代码已开源。EverMemOS印迹启发的自组织记忆 OS2026 年 1 月EverMemOSEverMind 团队从神经科学的「印迹engram」概念汲取灵感实现了一个三阶段记忆生命周期情景痕迹形成将连续对话流分割为 MemCell捕捉情景痕迹、原子事实和时间限定的前瞻信号Foresight。语义巩固将 MemCell 组织为主题性的 MemScene提炼稳定的语义结构并更新用户画像。重建性回忆执行 MemScene 引导的智能体检索组合必要且充分的上下文。EverMemOS 的四层架构类比大脑区域智能体层前额叶皮层、记忆层皮层网络、索引层海马体和 API/MCP 接口层。在 LoCoMo 上达到 92.3% 推理准确率在 LongMemEval-S 上达到 82%均为当时 SOTA。2026 年 2 月EverMind 正式发布了 EverMemOS 云服务和 $80,000 奖金的 Memory Genesis Competition 2026。AgeMem统一长短期记忆管理2026 年 1 月AgeMemAgentic MemoryYi Yu 等提出将长期记忆LTM和短期记忆STM的管理统一到 Agent 的策略中。不同于以往将 LTM 和 STM 作为独立组件的方法AgeMem 将记忆操作暴露为工具调用式的动作让 Agent 自主决定何时存储、检索、更新、摘要或丢弃信息。训练上采用三阶段渐进式强化学习策略并设计了步进式 GRPO 来应对记忆操作导致的稀疏和不连续奖励。在五个长程基准上AgeMem 一致性地超越了强记忆增强基线。MemRL基于强化学习的运行时自进化2026 年 1 月MemRLShengtao Zhang 等上海交大 MemTensor是记忆与强化学习结合的里程碑工作。其核心思想是将 LLM 的稳定认知推理与可塑的情景记忆显式解耦然后通过非参数强化学习在记忆上进行优化。具体而言MemRL 采用两阶段检索第一阶段按语义相关性过滤候选经验第二阶段根据学习到的 Q 值效用值进行选择。这些效用值通过环境反馈在试错过程中持续精炼使 Agent 能够区分真正有用的策略和表面相似但实际无用的噪声。在 HLE、BigCodeBench、ALFWorld 和 Lifelong Agent Bench 上MemRL 显著超越 SOTA 基线。在 ALFWorld 的序列推理任务上实现了 56% 的相对提升。关键优势在于模型参数完全冻结所有学习发生在记忆的效用估计上因此不存在灾难性遗忘。SimpleMem高效终身记忆2026 年 1 月SimpleMemJiaqi Liu 等聚焦于一个被忽视的实际问题记忆系统的 token 成本爆炸。一个 200 轮对话可能每次查询消耗约 17,000 token其中大部分是冗余的寒暄内容反而损害推理准确性。SimpleMem 提出基于语义无损压缩的三阶段流水线语义结构化压缩过滤低价值内容、生成原子化记忆单元、在线语义合成会话内即时整合相关记忆和意图感知检索规划根据查询复杂度动态调整检索范围。效果显著在 GPT-4.1-mini 上达到 43.24 F1vs. Mem0 的 34.20同时将 token 消耗从约 17,000 降至约 550——30 倍的效率提升。更令人振奋的是SimpleMem 使 1.5B 参数的小模型在记忆任务上接近 GPT-4o 的表现大大降低了准入门槛。Memory Matters More事件中心的记忆逻辑图2026 年 1 月该工作提出了以事件为中心的记忆组织方式将记忆建模为逻辑图以支持搜索和推理进一步拓展了记忆的结构化表示方向。ICLR 2026 MemAgents Workshop值得特别关注的是ICLR 2026 设立了专门的 Agent Memory 研讨会MemAgents: Memory for LLM-Based Agentic Systems这是顶级会议首次为 Agent Memory 设立独立 workshop。Workshop 提案明确指出了 Agent Memory 与 LLM 记忆化memorization的三个本质区别学习发生的时机在线交互中 vs. 预训练时、存储位置混合外部/结构化存储 vs. 纯参数化、治理方式显式读写策略和时间信用分配 vs. 不透明的参数保留。研讨会的核心议题涵盖记忆架构与机制、RL 驱动的记忆优化、多智能体记忆协同、记忆安全与隐私、以及神经科学启发的记忆设计。产业化进展与开源生态过去半年Agent Memory 的开源生态显著成熟从学术原型快速走向产业级部署项目核心特点状态Mem0通用记忆层语义提取 图数据库开源 (Apache 2.0)生产就绪Graphiti / Zep时序知识图谱双时态模型MCP Server开源核心 商业云服务EverMemOS印迹启发自组织三阶段生命周期开源 云 API 竞赛生态MemoryOSOS 风格分层架构EMNLP 2025开源MCP 即插即用A-MEMZettelkasten 风格动态链接与演化开源 (MIT)NeurIPS 2025SimpleMem语义无损压缩30x token 节省开源PyPI 可安装MemRLRL 驱动的情景记忆优化开源MAGMA四正交图策略引导遍历开源MemOS (MemTensor)LLM 记忆 OS技能记忆多模态开源v2.0 已发布一个值得注意的趋势是MCPModel Context Protocol正在成为记忆系统的标准接口协议。MemoryOS、Graphiti、SimpleMem 等多个项目都提供了 MCP Server使记忆能力可以即插即用地接入各类 Agent 框架和客户端。核心趋势总结趋势一从被动检索到主动推理早期的记忆系统本质上是「存了再查」——存储历史然后用语义相似度检索。2025-2026 的工作越来越强调记忆的主动性MAGMA 将检索重定义为图上的策略遍历AgeMem 让 Agent 自主决策记忆操作EverMemOS 实现自组织的记忆巩固。趋势二记忆与强化学习的深度融合MemRL 和 AgeMem 代表了将记忆管理纳入 RL 优化循环的趋势。记忆不再只是一个静态数据库而是 Agent 动作空间的一部分其读写策略通过与环境的交互持续优化。趋势三效率成为一等公民SimpleMem 的 30 倍 token 压缩表明记忆系统的效率问题已经从次要考虑升级为核心设计目标。在企业部署中token 成本直接决定了方案的可行性。趋势四神经科学启发的架构设计从 MemGen 的认知交织到 EverMemOS 的印迹生命周期再到 MemRL 的建设性情景模拟假说神经科学概念正在为 Agent Memory 提供越来越具体的设计指导而不仅仅是松散的类比。趋势五多图/多视图记忆表示单一向量存储的局限性已被广泛认识。MAGMA 的四正交图、Zep 的三层子图、EverMemOS 的 MemCell-MemScene 层级都指向同一个方向用多维度、多粒度的结构化表示替代扁平的向量检索。仍在探索的挑战遗忘机制仍是开发者公认的最大难题。如何自动判断信息已过时、应该被永久删除EverMemOS 的前瞻信号和 Zep 的时间失效机制提供了初步方案但通用的遗忘策略仍未形成。可扩展性方面随着记忆库从数百条增长到数十万条如何维持亚线性检索复杂度MAGMA 的多图剪枝和 SimpleMem 的语义压缩在不同维度上缓解了这个问题但面对真正的终身交互场景挑战依然存在。可信度问题不容忽视——记忆系统可能存储错误信息或过时事实污染 Agent 的后续行为。记忆的验证、冲突检测和可溯源性正在成为新的研究重点。评估标准化也是一个瓶颈。LoCoMo 和 LongMemEval 是当前最常用的基准但它们主要覆盖对话场景。面向更广泛的 Agent 任务如代码编写、网页浏览、机器人操作记忆系统的评估方法还有待完善。假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2408325.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…