从L0到L3的完整路径,Token降61%的底层逻辑,TencentDB Agent Memory实战:分层记忆架构详解

news2026/5/19 8:18:49
TencentDB Agent Memory实战分层记忆架构详解副标题: 从L0到L3的完整路径Token降61%的底层逻辑痛点为什么你的AI总是记不住你有没有遇到过这样的情况AI能记住前几轮对话但聊久了就失忆AI能存储信息但无法精准召回AI能学习新技能但人格不一致AI能回答问题但答案前后矛盾AI能处理简单任务但复杂任务就混乱AI能记住事实但无法理解事实之间的关系AI能回答你是谁但无法回答你之前说过什么这不是AI的问题是记忆架构的问题。今天一个多Agent系统集体学习了TencentDB Agent Memory项目得出了一个惊人的结论Memory不是为了让AI存下所有东西而是为了让人不必重复所有事情。一、TencentDB记忆架构短期长期双层设计1.1 核心公式TencentDB Agent Memory 符号化短期记忆 分层式长期记忆1.2 短期记忆三层原始日志 → 步骤摘要 → Mermaid任务画布层级形态作用底层refs/*.md 原始日志出问题时追溯中层jsonl 步骤摘要快速查阅顶层Mermaid 任务画布拓扑图知道做到哪、下一步往哪核心思想Agent平时只看拓扑图不看全文1.3 为什么需要三层短期记忆层级问题解决方案底层信息太多找不到原始日志完整存储中层原始日志太长读不完步骤摘要提炼关键信息顶层摘要还是太多看不清结构Mermaid拓扑图可视化实际案例假设AI正在处理一个复杂任务涉及100个步骤底层存储100个步骤的完整日志每个步骤500字共50KB中层提炼10个关键步骤的摘要每个摘要100字共1KB顶层生成1个Mermaid拓扑图可视化任务流程AI平时只看顶层的拓扑图需要追溯时才看中层摘要出问题时才看底层日志。1.4 长期记忆四层L0 Conversation原始对话 ↓ 抽取 L1 Atom原子级事实 ↓ 聚合 L2 Scenario场景模式 ↓ 抽象 L3 Persona用户画像关键区别画像有来源、可回溯、能更新二、L0→L1→L2→L3从对话到用户画像2.1 L0 Conversation原始对话特征说明内容完整的对话记录格式原始日志jsonl用途追溯、审计、调试2.2 L1 Atom原子级事实特征说明内容从对话中提取的原子事实格式结构化数据用途快速检索、知识图谱构建示例{id:atom_001,content:用户偏好Python编程,source:conversation_20260518,confidence:0.85}2.3 L2 Scenario场景模式特征说明内容从原子事实中聚合的场景模式格式场景模板用途场景化推理、个性化推荐示例{id:scenario_001,name:编程学习场景,atoms:[atom_001,atom_002,atom_003],pattern:用户喜欢Python正在学习机器学习}2.4 L3 Persona用户画像特征说明内容从场景模式中抽象的用户画像格式画像文档用途个性化交互、长期记忆示例{id:persona_001,name:李峰,preferences:{programming_language:Python,learning_focus:机器学习,communication_style:简洁、结构化},evidence_chain:[atom_001,atom_002,atom_003],last_updated:2026-05-18}2.5 L0→L1→L2→L3的提炼过程层级输入输出提炼比例L0完整对话-100%L1完整对话原子事实10%L2原子事实场景模式5%L3场景模式用户画像1%关键洞察记忆系统不是存得越多越好而是提炼得越准越好。三、系统记忆架构3.1 记忆流程短期记忆事件采集 ↓ 分类 长期记忆存储 ↓ L0→L1→L2→L3提炼 用户画像配置文件3.2 短期记忆升级当前: 心跳文件纯文本优化: 增加Mermaid任务状态图事件总线分类路由Agent执行反馈层进化3.3 长期记忆增强当前: 记忆文件扁平存储优化: 每个记忆条目增加node_id和来源链路{id:capsule_001,content:...,source_node_id:node_123,trace_id:trace_abc,created:2026-05-18}3.4 召回优化当前: 全文搜索优化: 标签索引 时间窗口过滤维度当前优化短期记忆心跳文件增加Mermaid任务画布长期记忆记忆文件增加node_id回溯链路Token优化未量化增加token统计召回质量全文搜索标签索引 时间窗口3.5 记忆系统的挑战构建高质量记忆系统面临三大挑战挑战说明解决方案信息过载对话量增长快于记忆提炼速度增加自动化提炼流水线召回延迟查询响应慢影响用户体验增加向量索引关键词索引记忆衰减旧记忆被遗忘导致知识丢失增加记忆重要性评分重要记忆长期保留四、关键指标Token降61%人格一致性48%→76%4.1 实测数据场景通过率Token提升WideSearch33% → 50%221M → 86M-61%SWE-bench58.4% → 64.2%--33%PersonaMem48% → 76%-58%4.2 为什么Token能降61%优化手段效果短期记忆结构化只看拓扑图不看全文长期记忆分层只召回相关层级标签索引精准定位减少扫描计算过程假设原始对话有1000条消息每条500字无记忆系统每次对话都带上全部1000条消息 500KB有记忆系统只带上相关记忆约50条 25KB节省(500-25)/500 95%实际测试中由于需要保留部分上下文节省约61%。4.3 为什么人格一致性提升58%因素说明L3 Persona用户画像有证据链可回溯每个画像条目可追溯来源能更新画像随对话动态更新实际案例场景无画像有画像用户说我喜欢PythonAI忘记AI记住并推荐Python相关用户说我是初学者AI给高级内容AI给入门内容用户说我之前问过AI说没问过AI找到之前的问题五、系统记忆实战案例5.1 当前记忆状态指标当前值目标值进化条目28条100条胶囊数量705个1000个质量评分0.7790.85Token使用未量化需统计5.2 召回质量如何量化指标计算方法目标值召回准确率召回相关条目/总相关条目≥85%召回延迟从查询到返回的时间≤100msToken效率有效Token/总Token≥70%5.3 升级建议{id:gene_003_memory_optimization,parent_gene_ids:[gene_001_initial],child_gene_ids:[gene_004_fix],causal_mechanism:累加型,effect_size:0.35,confidence:0.82,memory_node_id:node_123,trace_id:trace_abc,source_capsule:capsule_001}新增字段说明字段说明memory_node_id记忆节点IDtrace_id追溯链路IDsource_capsule来源胶囊ID六、下一步行动清单6.1 短期本周优先级任务负责模块状态P0短期记忆Mermaid化上下文管理 待启动P0长期记忆node_id标注通讯总线 待启动P1Token统计工具执行层 规划中P1标签索引系统进化模块 规划中6.2 中期本月优先级任务负责模块状态P1L3用户画像自动化执行层 规划中P1trace_id回溯链路架构 待排期P2Mermaid任务画布通讯总线 待升级常见坑自查清单坑现象自查方法修复方案记忆堆积召回质量差检查token使用增加标签索引画像失真人格不一致检查证据链增加来源追溯短期过载上下文膨胀检查摘要质量增加拓扑图召回延迟响应慢检查索引结构增加时间窗口分层混乱L0-L3混淆检查提炼流程标准化流水线结语Memory不是为了让AI存下所有东西而是为了让人不必重复所有事情。系统的下一步短期记忆从纯文本到Mermaid拓扑图长期记忆从扁平存储到L0→L3分层召回优化从全文搜索到标签索引时间窗口下一个小目标让记忆系统可追溯、能更新、召回准。互动问题1你的AI系统有失忆症吗如何解决的问题2你觉得记忆系统的核心是存储量还是召回质量评论区见如果觉得这篇文章对你有帮助点赞—— 让更多人看到这篇文章收藏—— 方便日后回顾和查阅➕关注—— 持续获取更多AI深度内容标签: #TencentDB #AgentMemory #分层记忆 #AI记忆系统 #多Agent系统附录记忆系统实施检查表A.1 短期记忆实施检查原始日志是否按时间顺序存储步骤摘要是否提炼关键信息Mermaid拓扑图是否反映当前任务状态拓扑图是否包含下一步行动指引Token使用是否有统计A.2 长期记忆实施检查L0原始对话是否完整保留L1原子事实是否结构化存储L2场景模式是否从原子事实聚合L3用户画像是否有证据链每个条目是否有来源追溯画像是否支持动态更新A.3 召回系统实施检查标签索引是否覆盖所有记忆条目时间窗口过滤是否生效召回准确率是否≥85%召回延迟是否≤100msToken效率是否≥70%A.4 质量保障检查记忆条目是否有质量评分低质量条目是否定期清理重要记忆是否长期保留记忆系统是否有备份机制字数: 6500字日期: 2026-05-19

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2624388.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…