AI的记忆问题解决了!最强记忆基准99%的准确率
AI的记忆能力正在迎来一次重大的飞跃。Supermemory团队近期公布了一项研究成果他们构建的一个实验性AI智能体流程在LongMemEval基准测试中达到了接近99%的准确率。团队表示这是智能体记忆前沿的新突破。智能体的记忆问题也许完全解决了Agent memory might be completely solved now。这项技术摆脱了传统向量数据库和嵌入的限制以一种全新的方式处理海量、复杂和随时间变化的信息。未来高度个性化AI智能体即将到来。AI记忆的新突破长期记忆是AI发展的关键挑战之一。要让AI真正理解和运用信息特别是处理那些跨越多个对话会话、包含矛盾信息、并随时间推移而更新的事实需要一种超越传统方法的记忆系统。LongMemEval基准测试正是为模拟这种真实世界的复杂性而设计的它包含了超过115,000个token的对话历史以及需要时间推理的问题。大多数现有的记忆系统在面对这些挑战时往往败在信息检索的准确性上即使能够检索到信息如果包含大量噪音大型语言模型LLM也难以有效利用。一个核心的难题在于如何准确地提取必要信息并判断一个已检索到的事实是否已被更新的事实所取代。Supermemory团队的解决方案名为ASMRAgentic Search and Memory Retrieval彻底改变了信息处理的思路。这项技术不仅易于实现更关键的是它完全不需要向量数据库或嵌入所有操作都可以在内存中完成这为将其集成到各种系统中甚至包括机器人打开了方便之门。多智能体并行协作的机制ASMR的核心在于其创新的数据摄取和检索管道。与传统的按块分割和嵌入用户会话不同ASMR部署了一个由三个并行读取观察智能体组成的智能体编排器。这些智能体基于Gemini 2.0 Flash模型能够并发读取原始对话记录并针对个人信息、偏好、事件、时间数据、更新内容以及助手信息这六个维度进行目标化知识提取。提取出的结构化信息随后以原生格式存储并与它们的来源会话进行映射。当用户提出问题时ASMR不依赖于查询向量数据库。取而代之的是它部署了三个并行搜索智能体每个智能体都有特定的搜索侧重。第一个智能体负责搜索直接事实和明确陈述第二个智能体则关注相关的上下文、社交线索和潜在的含义第三个智能体则致力于重构时间线和关系图谱。编排器会汇总所有搜索智能体的发现提取逐字会话摘录以进行详细验证从而实现基于实际认知理解而非仅仅关键词或数学相似度的智能检索。为了应对LongMemEval测试中多样化的提问类型ASMR设计了两种不同的智能体回答流程。第一种是“8-变体合集”。在此流程中检索到的上下文被路由到8个高度专业化的提示变体中进行并行处理。每个变体独立评估上下文并生成答案。只要其中8个不同的推理路径之一能够成功得出正确答案该问题就被标记为正确。这种并行多重判断的方法使得整体准确率达到了令人瞩目的98.60%。第二种是“12-变体决策森林”。在这个流程中12个高度专业化的智能体基于GPT-4o-mini独立回答问题。随后一个聚合器AggregatorLLM充当最终的裁判。聚合器通过多数投票、领域信任度和冲突解决机制综合12个答案得出一个单一的、权威性的结论。这一共识模型也实现了高达97.20%的准确率。关键洞察与未来展望构建一个在生产级基准测试中达到近99%准确率的系统为Supermemory团队带来了几个重要的工程洞察。智能体检索优于向量搜索。抛弃向量嵌入转向主动搜索智能体是实现突破的关键。智能体通过主动搜索上下文有效避免了传统RAG在处理时间变化和信息更新时遇到的“语义相似性陷阱”。并行处理至关重要。将数据摄取和信息检索工作负载分配给多个专用智能体3个读取3个搜索极大地提高了信息提取的速度和精度。同时每个智能体都有其专门的侧重点这有助于防止信息冲突。专精化胜过泛化。将上下文路由到专门的智能体如“反驳者”或“细节提取者”进行处理其效果远远优于使用单个通用提示。尽管这是一个实验性的沙盒环境而非Supermemory的核心生产引擎但团队计划将完整的代码开源以供AI社区学习和构建。他们正在积极探索将这些纯智能体检索技术应用于核心生产环境。预计4月初Supermemory将公开发布并开源这一新智能体记忆系统的所有细节。AI的记忆问题或许真的已经找到了解决之道Supermemory这篇文章引起了不小的轰动。许多网友表示太烧Token了吧、3并行摄入 12判断 慢贵。研究员表示开源的3B中国模型技术上也是可以的。ASMR真的解决了记忆问题吗网友们表示还有三大挑战如此多LLM调用的延迟挑战规模到百万Token时仍需验证摄入质量上游应该存储什么数据仍是天花板。参考资料https://x.com/DhravyaShah/status/2035517012647272689https://github.com/supermemoryai/supermemory
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2445256.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!