Mem0.ai研究团队开发的全新记忆架构系统“Mem0”正式发布

news2025/5/9 18:42:50

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

2025年4月30日,一项由Mem0.ai研究团队开发的全新记忆架构系统“Mem0”正式发布 (https://github.com/mem0ai/mem0),旨在解决当前大型语言模型(LLM)在跨会话持久记忆方面的核心短板。尽管现代LLM已经能够生成流畅的回复、模仿语气并执行复杂指令,但在需要长期连续性场景中的表现依然受限,如个人助手、健康管理或教育辅导等应用。在真实的人类交流中,人们会记住他人偏好、推断行为并随时间构建心理地图。例如,一位用户若在上周提到饮食禁忌,便期望AI在未来涉及饮食话题时自动考虑这些限制。然而缺乏跨会话记忆机制的AI助手往往无法维持一致性,从而影响用户信任。

当前LLM面临的主要难题是:无法将关键信息持久保留在对话上下文窗口之外。即使一些模型已扩展到128K或200K的token容量,但在涉及跨天或跨周的长对话中,这样的容量仍显不足。同时,随着token距离的拉远,模型对早期上下文的注意力质量逐渐下降,导致无法准确提取或应用早前内容。一旦用户在对话中跳转主题并最终回到原始话题,AI极有可能遗漏或错误引用此前提供的关键信息,进一步造成对话脱节。

为弥补这一缺陷,已有若干方案尝试引入记忆功能。一些系统采用“检索增强生成”(RAG)技术,通过相似度搜索在对话中提取相关文本片段;另一些则采取“全上下文”策略,直接将整段对话重新输入模型,但这种方式会带来延迟高、成本高等问题。还有一些专有与开源记忆模块尝试借助向量数据库或结构化格式存储对话记录,但这些方法往往存在效率低下、冗余信息回溯、更新整合能力不足的问题,且缺乏冲突检测与更新优先级排序机制,导致AI记忆支离破碎,影响推理能力。

为此,Mem0.ai团队提出了一种具备动态抽取、整合与回溯能力的记忆架构系统Mem0。该系统可在对话过程中自动筛选出有价值的事实,判断其相关性与独特性,并将其整合至可被未来会话调用的记忆存储中。研究团队还推出了增强版本Mem0g,在此基础上引入图谱结构,将信息以关系图的形式建构,从而强化模型在跨会话链条推理中的能力。研究人员使用LOCOMO基准测试框架对Mem0和Mem0g进行了评估,并将其与六种不同类型的记忆系统对比,包括RAG模型、全上下文方法、开源和专有工具等,结果显示Mem0在所有关键指标上均实现领先。

Mem0系统核心由两个操作阶段组成。第一阶段中,模型将处理用户提问与AI响应的对话对,以及近期对话的摘要信息。输入由全局对话摘要与最近10条消息构成,模型据此抽取出关键事实。进入第二阶段后,这些事实将与向量数据库中相似记忆进行比对,并检索出最相似的前10条记忆。随后通过一种名为“工具调用”的决策机制,由LLM本身判断该事实应被新增、更新、删除或忽略。此机制无需外部分类器支持,实现了更高效的记忆管理,减少了冗余内容。

更高级的Mem0g架构则将对话信息以图结构表示,将人物、城市、偏好等实体建为节点,诸如“居住于”、“偏好”等关系则作为边连接节点,形成语义三元组。每个节点具备标签、嵌入向量与时间戳,而三元关系则提供对话中的语义链条。此种结构有助于模型在多轮对话中进行更复杂的逻辑推理。例如,若用户讨论旅行计划,系统将为城市、时间、同伴分别建构节点,逐步累积成可导航的信息图谱。该过程完全由LLM完成,自动识别实体并分类构图。

在性能评估中,Mem0在“LLM作为评判者”(LLM-as-a-Judge)这一标准上相较OpenAI的记忆系统提升了26%;而Mem0g通过图增强设计进一步提高2%,总提升达28%。在效率方面,Mem0相较全上下文方法将p95响应延迟降低91%,同时在token使用上节省超过90%。这种在性能与实用性之间的平衡使其极具生产环境部署价值,尤其是在响应时间与计算资源至关重要的应用场景中。

此外,这些模型还展现出在多种类型提问任务中的出色能力,包括单跳事实检索、多跳推理及开放领域问题,在准确率方面全面领先其他记忆系统。

研究总结指出以下关键成果:

  • Mem0采用两阶段架构抽取与管理关键对话事实,结合近期对话与全局摘要形成上下文提示。
  • Mem0g将记忆构建为带有方向关系的图结构,强化对复杂信息链条的推理能力。
  • Mem0在评估中相较OpenAI系统提高26%,Mem0g再提升2%,总计提升达28%。
  • Mem0在p95延迟方面减少91%,token消耗节省逾九成,相较全上下文方法表现优异。
  • 两种架构在多会话处理下仍维持高性能与低成本,适合在实际部署环境中广泛应用。

研究团队指出,Mem0架构尤其适用于需要长期对话记忆的AI助手,如教育辅导、健康照护、企业服务等关键领域,能够显著提升交互连贯性与用户信任度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2371702.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

通过DeepSeek大语言模型控制panda机械臂,听懂人话,拟人性回答。智能机械臂助手又进一步啦

文章目录 前言环境配置运行测试报错 前言 通过使用智能化的工作流控制系统来精确操控机械臂,不仅能够基于预设算法可靠地规划每个动作步骤的执行顺序和力度,确保作业流程的标准化和可重复性,还能通过模块化的程序设计思路灵活地在原有工作流中…

如何添加或删除极狐GitLab 项目成员?

极狐GitLab 是 GitLab 在中国的发行版,关于中文参考文档和资料有: 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 项目成员 (BASIC ALL) 成员是有权访问您的项目的用户和群组。 每个成员都有一个角色,这决定了他们在项目中可以…

计算机网络-LDP标签发布与管理

前面学习了LDP建立邻居,建立会话,今天来学习在MPLS中的标签发布与管理。 在MPLS网络中,下游LSR决定标签和FEC的绑定关系,并将这种绑定关系发布给上游LSR。LDP通过发送标签请求和标签映射消息,在LDP对等体之间通告FEC和…

云境天合水陆安全漏电监测仪—迅速确定是否存在漏电现象

云境天合水陆安全漏电监测仪是一种专为水下及潮湿环境设计的电气安全检测设备,通过高灵敏度电磁传感器探测漏电电流产生的交变磁场,基于法拉第电磁感应定律,自动区分高灵敏度信号和低灵敏度信号,精准定位泄漏电源的具体位置。一旦…

软考 系统架构设计师系列知识点之杂项集萃(54)

接前一篇文章:软考 系统架构设计师系列知识点之杂项集萃(53) 第87题 某银行系统采用Factory Method方法描述其不同账户之间的关系,设计出的类图如下所示。其中与Factory Method的“Creator”角色对应的类是(&#xff…

Nginx +Nginx-http-flv-module 推流拉流

这两天为了利用云服务器实现 Nginx 进行OBS Rtmp推流,Flv拉流时发生了诸多情况,记录实现过程。 环境 OS:阿里云CentOS 7.9 64位Nginx:nginx-1.28.0Nginx-http-flv-module:nginx-http-flv-module-1.2.12 安装Nginx编…

KeyPresser 一款自动化按键工具

1. 简介 KeyPresser 是一款自动化按键工具,它可以与窗口交互,并支持后台运行, 无需保持被控窗口在前台运行。用户可以选择要操作的目标窗口,并通过勾选复选框来控制要发送哪些按键消息。可以从组合框中选择所需的按键,并在编辑框中输入时间间隔以控制按键发送之间的延迟。程…

DVWA靶场保姆级通关教程--03CSRF跨站请求伪造

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 目录 文章目录 前言 一、low级别的源码分析 二、medium级别源码分析 安全性分析 增加了一层 Referer 验证: 关键点是:在真实的网络环境中&a…

架构思维:构建高并发读服务_基于流量回放实现读服务的自动化测试回归方案

文章目录 引言一、升级读服务架构,为什么需要自动化测试?二、自动化回归测试系统:整体架构概览三、日志收集1. 拦截方式2. 存储与优化策略3. 架构进化 四、数据回放技术实现关键能力 五、差异对比对比方式灵活配置 六、三种回放模式详解1. 离…

Qt实现车载多媒体项目,包含天气、音乐、视频、地图、五子棋功能模块,免费下载源文件!

本文主要介绍项目,项目的结构,项目如何配置,项目如何打包。这篇文章如果对你有帮助请点赞和收藏,谢谢!源代码仅供学习使用,如果转载文章请标明出处!(免费下载源代码)&…

【PostgreSQL】超简单的主从节点部署

1. 启动数据库 启动主节点 docker run --name postgres-master -e POSTGRES_PASSWORDmysecretpassword -p 5432:5432 -d postgres启动从节点 docker run --name postgres-slave -e POSTGRES_PASSWORDmysecretpassword -p 5432:5432 -d postgres需要配置挂载的存储卷 2. 数据…

zotero pdf中英翻译插件使用

最近发现一个pdf中英翻译的神器zotero-pdf2zh,按照官方安装教程走一遍的时候,发现一些流程不清楚的问题, 此文就是整理一些安装需要的文件以及遇到的问题: 相关文件下载地址 Zotero 是一款免费的、开源的文献管理工具&#xff0…

WSL(Windows Subsystem for Linux)入门

目录 1.简介2.安装与配置3.常用命令4.进阶使用4.1 文件系统交互4.2 网络互通4.3 配置代理4.4 运行 GUI 程序4.5 Docker 集成 1.简介 WSL 是 Windows 系统内置的 Linux 兼容层,允许直接在 Windows 中运行 Linux 命令行工具和应用程序,无需虚拟机或双系统…

Python项目73:自动化文件备份系统1.0(tkinter)

主要功能说明: 1.界面组件:源文件夹和目标文件夹选择(带浏览按钮),备份间隔时间设置(分钟),立即备份按钮,自动备份切换按钮,状态栏显示备份状态。 2.进度条显…

C++:扫雷游戏

一.扫雷游戏项目设计 1.文件结构设计 首先我们要先定义三个文件 ①test.c //文件中写游戏的测试逻辑 ②game.c //文件中写游戏中函数的实现等 ③game.h //文件中写游戏需要的数据类型和函数声明等 2.扫雷游戏的主体结构 使⽤控制台实现经典的扫雷游戏 •游戏可以通过菜单…

使用xlwings将excel表中将无规律的文本型数字批量转化成真正的数字

之前我写了一篇文章excel表中将无规律的文本型数字批量转化成真正的数字-CSDN博客 是使用excel自带的操作,相对繁琐。 今天使用xlwings操作,表格如下(有真正的数字,也有文本型数字,混在在一起)&#xff1…

文件包含 任意文件读取

文件处理漏洞--文件包含 - wizard骑士 - 博客园 1,什么是文件包含 程序开发人员一般会吧重复使用的函数写道单个文件中,需要使用某个函数时直接调用此文件,无需再次编写,文件调用的过程就是文件包含,所以将包含的文件…

缓存套餐-01.Spring Cache介绍和常用注解

一.Spring Cache 要使用直接导入坐标即可。 如何选择底层的缓存实现呢?只要导入对应的缓存坐标即可。如果要使用redis作为缓存实现,那么只需要导入redis的maven坐标。 二.常用注解 Cacheable:不光往缓存中写缓存数据,而且会从缓…

C++类与对象—下:夯实面向对象编程的阶梯

9. 赋值运算符重载 9.1 运算符重载 在 C 里,运算符重载能够让自定义类型的对象像内置类型那样使用运算符,这极大地提升了代码的可读性与可维护性。运算符重载本质上是一种特殊的函数,其函数名是 operator 加上要重载的运算符。 下面是运算…

Linux中安装mysql8,转载及注意事项

一、先前往官网下载mysql8 下载地址: https://dev.mysql.com/downloads/选择Linux 二、删除Linux中的mysql(如果有的话),上传安装包 1、先查看mysql是否存在,命令如下: rpm -qa|grep -i mysql如果使用这…