Agent记忆架构从入门到精通:10种方案全解析,收藏这篇就够了!

news2026/4/6 23:03:49
继续看Agent记忆进展看10种Agent记忆方案对比总结可以借此机会看看这些记忆系统在设计的时候都有哪些组件有哪些优化策略以及有哪些经验。【我们已经陆陆续续讲了多个了也有一些综述但拉到一个框架上做抽象的回顾其实也蛮有必要】说实话Memory怎么构成还是要看Agent怎么用单独的扯出来评估其实还是没什么太大的用处的得看agent怎么用也取决于整个系统设计以及使用的llm有多聪明。但是呢做论文得控制变量分析各个模块和策略拉到一个平面上去比才能写出论文。当然其实还有很多比如memu、evermemOS等等特别多的都很同质化有的越搞越复杂但搞得跟langchain一样会最终变成代码shit mountain并不总是好事儿。一种感觉就是记忆单独做系统其实不是太成立它还是要跟着具体业务问题走的比如这些 很多都是最后拓展成为rag【很多都是】、deepresearch、deepsearch、agent平台这种去做其实在某种程度上已经做了某种偏离。不过最下限的对于了解有哪些策略实现机理倒是可以的有意义的。一、10种Agent记忆方案概览记忆本质就是对朴素上下文的一个精细化雕琢增强继续看Agent记忆这块的内容拉到一个框架下做对比将现有10种代表性LLM智能体记忆方法A-MEM、MemoryBank、MemGPT、Mem0/0ᵍ、MemoChat、Zep、MemTree、MemoryOS、MemOS一起做个对比。先给个地址1、A-MEMhttps://arxiv.org/abs/2502.12110https://github.com/WujiangXu/AgenticMemory主要思路是通过动态索引和链接来创建相互关联的知识网络。当添加新记忆时会生成包含多个结构化属性包括上下文描述、关键词和标签的综合笔记。2、MemoryBankhttps://arxiv.org/abs/2305.10250https://github.com/zhongwanjun/MemoryBank-SiliconFriend主要思路是融入了受艾宾浩斯遗忘曲线理论启发的记忆更新机制该机制允许人工智能根据时间流逝和记忆的相对重要性来遗忘或强化记忆。3、MemGPThttps://arxiv.org/abs/2310.08560https://github.com/letta-ai/letta主要特点是来源于传统操作系统中的分层存储系统扩展大型语言模型有限上下文窗口内的上下文并利用中断机制来管理其与用户之间的控制流。4-5、Mem0 / Mem0https://arxiv.org/abs/2504.19413https://github.com/mem0ai/mem0主要特点是个性化通过动态地从正在进行的对话中提取、整合和检索信息。6、MemoChathttps://arxiv.org/abs/2308.08239https://github.com/LuJunru/MemoChat主要特点是通过迭代的“记忆-检索-回复”循环来优化长程开放域对话让大模型利用结构化备忘录来记忆和检索过去的对话从而在参与未来的对话时提高一致性。7、Zep (Graphiti)https://arxiv.org/abs/2501.13956https://github.com/getzep/graphiti特色是做时间感知能力的知识图谱引擎动态地综合非结构化对话数据和结构化业务数据同时保持历史关系引入图谱做也就是graphrag的变体。8、MemTreehttps://arxiv.org/abs/2410.14052没有官方实现主要差异性是利用动态树状记忆表示来优化信息组织、检索和整合以层级方式组织记忆每个节点封装了聚合的文本内容、相应的语义嵌入以及跨越树深度的不同抽象层级通过计算和比较新旧信息的语义嵌入来动态调整这种记忆。9、MemoryOShttps://arxiv.org/abs/2506.06326https://github.com/BAI-LAB/MemoryOS上升到操作系统层特点是分层存储架构由四个关键模块组成记忆存储、更新、检索和生成包含三个层级的存储单元短期记忆、中期记忆和长期个人记忆关键操作包括存储单元之间的动态更新短期到中期的更新遵循基于对话链的先进先出原则而中期到长期的更新则采用分段页面组织策略。10、MemOShttps://arxiv.org/abs/2507.03724https://github.com/MemTensor/MemOS这个很抽象将记忆视为可管理系统资源的记忆操作系统搞了一整套的复杂的抽象组件【看的有点麻】然后这些其实可以细分拆解为信息提取、记忆管理、记忆存储、信息检索四大核心组件做不同方法的系统化抽象和差异对比先看个大的点二、10种Agent记忆方案对比总结对应的工作在《Memory in the LLM Era: Modular Architectures and Strategies in a Unified Framework》https://arxiv.org/pdf/2604.01707可以看6个核心点对应的评测框架在https://github.com/Yanchen398/Memory-in-the-LLM-Era。首先是一个典型的Agent记忆系统的构成1、信息提取Information Extraction策略从交互消息中筛选、提取用于更新记忆的有效信息过滤冗余细节核心有3种实现方式直接归档这是最朴素方式统仅对原始消息和时间戳进行归档不进行任何处理如MemoryBank、MemGPT摘要式提取利用大模型从一个或多个对话轮次中生成简洁的信息摘要。记忆方法如A-MEM和Mem0提取关键词和上下文标签或提示大模型生成原始文本的抽象摘要这个其实很多都是prompt提示的机制图式提取这里的逻辑是通过LLM提取细粒度的实体和关系形成用于知识图谱构建的主语–谓语–宾语三元组结合时间元数据构建知识图保留结构化关联如Mem0ᵍ、Zep】这个也是靠prompt做2、记忆管理Memory Management策略可以对现有的记忆系统做个各个维度的比对如下五大操作可以做个列举其一关联相关经验在具有语义相似度、时间接近性或上下文相关性的记忆条目之间建立显式连接通过图中的结构边或离散记录间的关联链接实现如A-MEM和 MemoryOS等记忆方法利用基于语义相似度或连续性的关联链接Zep和 Mem0 专注于连接单个回合或实体结点。其二整合碎片化记忆逻辑是对分散的记忆进行抽象/摘要减少冗余MemoryBank将重复的日常记录聚合为事件摘要并随着经验积累不断优化全局用户画像MemoChat将相关对话按共享主题分组并生成主题级别的摘要其三跨记忆层级转换目的是将短期记忆迁移为长期记忆如MemoryOS的FIFO短期→中期热度评分中期→长期、Zep的语义社区形成。具体的MemoryOS实现两阶段迁移策略短期记忆首先按照先进先出FIFO策略迁移到中期存储随后中期记忆通过基于热度的得分被提升至长期存储该得分综合考虑访问频率和最近性。其四更新现有记忆主要分3种范式根据预定义规则对现有记忆进行更新MemoryBank采用艾宾浩斯遗忘曲线理论来随时间调整记忆强度。在MemoryOS 中新记忆根据语义和关键词相似性被整合到现有结构中、LLM驱动通过提示大型语言模型来总结、合并或解决条目之间的冲突。例如MemTree通过语言模型执行专门的聚合操作来更新其记忆其中提示内容和子节点数量引导语言模型在将新内容写回父结点前适当压缩并泛化信息以及智能体驱动智能体自主决定应用何种操作如修改、合并、修剪如MemGPT的自主工具调用。其五过滤无效信息实现上移除/降权过时/冗余记忆分基于使用的策略MemoryOS的访问频率时间衰减依赖于访问频率和时间衰减。创建时间久远且很少被检索的记忆会优先被过滤基于内容的策略Mem0的语义相似度去重通过分析语义相似度并利用大模型检测和过滤重复或过时的知识但这种粒度并不好控制。3、 记忆存储Memory Storage策略基于的存储取决于组织方式和表示方式怎么存存谁是关键。分开看对于组织方式而言也是有不同的形式扁平式存储单一存储池如FIFO队列堆栈stack先进先出也可以是JSON文件如MemoryBank、分层存储多粒度/多用途存储池如MemoryOS的短期/中期/长期三层用于及时对话的短期记忆、用于主题摘要的中期记忆以及用于用户偏好的长期记忆对于表示方式而言包括向量存储文本编码为高维嵌入基于相似度检索如FAISS/Qdrant绝大多数方法采用、图存储树/知识图/时间图保留结构关系。这个图存储的可以展开看如MemTree将记忆组织成层次化树形结构其中每个结点封装了聚合的文本内容沿着树的深度提供不同层次的抽象Zep采用分层的时序知识图谱同时通过将原始消息表示为结点、提取主语–谓语–宾语三元组并将实体聚类为社区来组织记忆。4、信息检索Information Retrieval阶段检索方面也是4种范式。其一词汇检索这是常见的检索就是RAG包括基于token/术语重叠如BM25、杰卡德相似度适合精确实体/短语匹配其二向量检索基于连续向量空间的语义相似度余弦相似度ANN算法解决词汇失配问题最主流其三结构检索主要思路是利用记忆实体之间的显式关系连接通常在基于图形或层次化存储上操作通过图遍历、邻域扩展或多跳推理来检索相互关联的信息簇而非简单的查询到条目匹配。其本质都是基于图/分层存储的显式关系通过图遍历/多跳推理检索关联信息如Mem0ᵍ的子图构建、Zep的BFS遍历Mem0从通过相似度搜索识别出的结点出发探索其关系以构建一个全面的子图从而捕捉相关且多方面的信息。类似地Zep采用基于广度优先搜索的图遍历算法通过识别额外的结点和边来增强初始搜索结果其四LLM辅助检索这个主要针对模糊的场景具体的将LLM作为推理组件重构模糊查询、识别关键实体引导精准检索如MemoChat。5、看评估测试基准基准侧也可关注两个代表性的也是打榜主要阵地一个是LOCOMO基于人类间的长程对话含10个对话、平均198.6个问题、27.2个会话、588.2个对话轮次评估单跳/多跳检索、时间推理、开放域知识四大能力一个是LONGMEMEVAL基于用户-AI的长程交互含500个问题、平均50.2个会话、11.5万个token评估信息提取、多会话推理、知识更新、时间推理四大核心记忆能力6、看关键结论有了统一的对比框架和对比基准就可以看一些对比结论可以看看几个经验结论首先基于树状/分层的存储结构记忆方式占优。MemTree、MemOS树状、MemoryOS分层表现最优树结构在上层保留概念摘要、叶子节点保留细粒度细节分层存储实现信息的高效流动和转换因此这也是一个经验教训分层组织在捕捉信息之间的结构关系方面更为有效这可以通过采用基于树的索引或设计多级存储来实现。其次信息完整性至关重要。这也是教训信息完整性是记忆机制的基础保留原始消息的方法优于仅提取图三元组的方法如Mem0优于Mem0ᵍ结构化提取易导致语义丢失【这个是很自然的】。接着记忆关联能力是多跳推理的核心缺乏显式/隐式关联操作的方法MemoryBank、MemGPT在多会话/多跳任务中表现极差Mem0通过相似记忆同步更新实现了隐式关联性能显著提升【索引带来的增益】最后时间推理强依赖LLM推理能力模型从7B→72B时时间推理任务性能翻倍如MemoryOS、MemoChat现有方法缺乏专门的时间信息处理组件【所以时空的处理是关键的】此外在token消耗上也存在一些趋势其一通过对比每次对话的平均token消耗Y轴与总体F1得分X轴之间的关系可以看到通常情况下更高的性能与更高的token消耗相关MemTree 和 MemOS 实现了高准确率但它们带来了显著的 token 开销。其二信息处理的粒度对token成本有显著影响这一粒度取决于信息是从单个对话回合中提取还是从多个回合中集体提取。例如MemoryOS将对话划分为片段以进行中期存储而MemoryBank则以每日粒度将历史消息汇总成摘要但因为大模型本身能力就不错所以这种粒度上的粗化并不一定导致性能下降甚至可能提升性能。其三索引机制还需要关注扩展性这个尤其是在频繁更新的场景。对于MemTree随着对话历史的累积树的深度增加导致每轮处理的成本上升因为每次自顶向下插入新的对话结点都需要更新路径上的所有结点。类似地Zep 的图复杂度随对话轮次的增加而增长导致去重和一致性维护的成本不断上升。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2490603.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…