当AI的键值记忆遇上大脑:原来我们和AI共享同一套记忆逻辑
导语在日常经验中我们常把“遗忘”理解为信息的流失时间久了记忆就会慢慢消失学习新知识也可能覆盖旧内容。然而从短视频推荐到大语言模型再到人类被线索唤醒的记忆体验这些现象或许指向另一种解释。这篇发表于 Neuron 的研究提出“键值记忆”框架将记忆拆分为“索引”与“内容”两个部分海马体负责提供检索线索新皮层负责存储信息本身。在这一视角下遗忘不再是内容消失而更像是“找不到入口”——信息仍在只是暂时无法被提取。这一跨越人工智能与脑科学的统一模型不仅重塑了我们对记忆机制的理解也为持续学习与智能系统设计提供了新的思路。关键词键值记忆key–value memory、海马体、新皮层、记忆检索、遗忘机制、Transformer、持续学习、认知神经科学来源集智俱乐部作者贾梓杏审校张江刷短视频时平台似乎总能“刚好知道你想看什么”用AI写文案时模型可以顺畅地接着你的思路往下生成而当我们回忆童年趣事一些零散的线索——一段旋律、一种气味——往往就能勾起完整的场景。这些看似毫不相关的体验其实都指向一个共同的问题信息是如何被“存住”又是如何被“找回”的在人工智能中一个常见的解释是键值记忆key–value memory系统通过线索定位信息再提取对应内容。近年来神经科学研究也提出类似视角。2025年发表于Neuron的论文《Key-value memory in the brain》尝试用“索引—内容分工”来理解大脑海马体更偏向提供检索线索新皮层更多承担信息存储。这并不意味着大脑就是一个简单的“键值系统”但这个框架提供了一种有启发性的统一视角让我们重新审视一个熟悉却复杂的问题记忆是如何被组织的又为什么会“遗忘”。一、什么是键值记忆AI的“记忆秘诀”很简单键值记忆听起来专业实则逻辑我们每天都在用手机通讯录里姓名是“键”Key电话号码是“值”Value找姓名就能快速查号码——这就是它的核心“键”定位“值”存储分工明确。AI领域里键值记忆早已是标配ChatGPT等大模型的Transformer架构、检索增强生成RAG技术核心都是键值配对。它的优势源于对传统记忆模型短板的突破。传统自联想记忆Auto-Associative Memory如图1左图所示可以追溯到神经科学先驱约翰·霍普菲尔德在上世纪提出的Hopfield网络。在这个模型中记忆以整体模式的形式被存储只要给定一个不完整或带噪声的输入网络就会自动“收敛”到最接近的完整记忆。这种机制就像把照片和名字写在同一张纸上——回忆时需要同时还原整个内容因此一旦信息变多或彼此相似就容易混淆或出错。而键值记忆将“定位”和“存储”分开“键”只负责找位置“值”只负责存内容像书的目录键和正文值各司其职、互不干扰。以回忆过程为例只需要给模型一个轻量的Key而不是一个全量的内容就能实现Key到Value的查找。键值记忆的流程只有两步和查字典、找通讯录完全一致1. 写入记忆将“键”和“值”绑定存入系统比如记单词时拼写是键、中文意思是值2. 读取记忆用“查询线索”匹配键提取对应的值比如看到单词拼写提取中文意思。图 1自联想记忆与键值记忆的结构对比作者绘制前者通过整体模式匹配进行记忆恢复后者将记忆拆分为“键”用于定位与“值”用于存储实现解耦检索。神奇的是Transformer、多层感知机MLP乃至人类大脑都是这套流程的不同实现——这正是论文最核心的发现人工与自然智能记忆底层逻辑高度一致。二、大脑的“键值分工”海马体是“索引员”新皮层是“仓库管理员”人类大脑本身就是一套天然的键值记忆架构论文通过大量实验明确了两个核心脑区的分工海马体负责“键”新皮层负责“值”。简单认识两个脑区海马体是“记忆之门”体积小但关键受损会导致无法形成新记忆新皮层是“记忆仓库”占大脑大部分体积存储常识、技能、感官体验等。过去科学家只知两者分工不同却不懂协同逻辑。直到1995年O’Reilly等人的工作[1]发表人们才认识到海马体不存具体内容只编“索引”键新皮层不负责定位只存“内容”值。比如第一次去某一家特别的餐厅海马体编码“键”——位置、装修、同行的人新皮层存储“值”——味道、心情。后来看到相似装修查询线索海马体匹配键从新皮层提取值完整记忆就浮现了。图 2大脑中海马体和皮层的位置示意图蓝色弯曲状的区域即为海马体图源[1]论文基于大量经典认知神经科学实验建立了海马体编码键、新皮层存储值的分工框架。其中两组实验证据[2][3]最直接、可重复性最强:实验1记忆并未消失而是会随时间发生泛化并可被线索重新精确化为了检验记忆是在消失还是在变得难以精确提取研究者设计了经典的情境恐惧实验。大鼠在环境A中经历电击后会形成情境特异性恐惧记忆。在短期测试中这种记忆表现得非常精确大鼠能区分高度相似的环境B和完全不同的环境C只在A表现出明显恐惧反应。但随着时间推移这种精确性下降——大鼠开始对相似环境B也产生恐惧反应表现出明显的“记忆泛化”。关键发现是这种变模糊的记忆并非真正丢失。当研究者只提供一个简单线索例如将大鼠短暂带回环境A进行提示后大鼠对A与B的区分能力可以恢复重新表现出对A的特异性恐惧反应。这一结果表明记忆内容本身仍然存在只是随着时间推移检索过程变得不稳定导致提取结果变得泛化而合适的线索可以重新激活原本精确的记忆使其“从模糊回到清晰”。图 3小鼠情境恐惧实验流程图[4]。大鼠在环境A形成恐惧记忆短期内可区分相似环境B与不同环境C但随时间出现泛化通过回到A进行提示后记忆可重新恢复精确性。实验 2海马体通过拉开相似记忆的表征来减少混淆实现索引分离为了理解大脑如何区分高度相似的记忆研究者让大鼠学习两条高度重叠的迷宫路线约80%路径相同并要求它们准确区分不同路线以获得食物奖励。在学习初期由于两条路线高度相似大鼠容易混淆对应的神经活动模式也彼此接近。随着学习深入海马体中的表征逐渐发生变化即使在重叠路段两条路线的神经活动模式也被明显拉开相似度持续下降。这种变化与行为表现直接相关——表征分离越明显大鼠的区分准确率也越高。相比之下新皮层中的表征始终保持较高相似性更稳定地反映路线本身的视觉与空间特征并不会主动放大差异。这说明在面对相似记忆时大脑并不是单纯依赖存储内容来区分而是通过海马体提高不同记忆之间的区分度减少检索时的相互干扰。相对而言新皮层更专注于保持内容本身的稳定与完整。从这个角度看两者形成了一种分工一侧负责把相似记忆区分开另一侧负责把内容尽可能准确地保留下来。这种分工方式与键值记忆中定位与存储分离的思路是相契合的。三、我们到底为什么会“遗忘”从键值记忆的视角来看遗忘不再被简单理解为记忆内容的逐渐消失。相关研究如Berens et al.[4]提出记忆表现下降往往可以拆解为两个维度能否被提取以及提取是否精确。很多情况下大脑记忆一旦存储就长时间保存在新皮层不会被擦除遗忘本质是海马体的“键”失效找不到索引无法提取内容。这一观点与“键值记忆”框架形成了直接对应关系如果将记忆内容视为“值”将检索线索视为“键”那么遗忘更可能发生在“键”失效或匹配困难的环节而不是“值”本身被删除。在这一假说下一个自然的问题是这种“检索失败”是否能够在行为实验中被观察到。为此研究者设计了两类经典实验。第一类实验关注时间对记忆表现的影响。受试者需要记忆屏幕上目标出现的位置并在不同时间间隔后进行回忆测试。结果显示随着时间延长能够成功回忆的人数下降但只要能够回忆他们报告坐标的精度与第一天毫无差别。这说明记忆内容值始终清晰变弱的是海马体的索引能力键——时间久了线索匹配效率下降导致“搜不到”而非“记错了”。第二类实验则考察干扰的作用。受试者依次学习多组单词列表并在最后回忆其中某一组。结果发现被遗忘程度主要取决于该组内部信息的复杂度而与后续学习内容的长度关系不大。这意味着遗忘并非“新记忆覆盖旧记忆”而是相似记忆的索引互相竞争、互相干扰导致检索失败。四AI的“遗忘”能被“唤醒”有趣的是键值记忆框架也为理解AI的“灾难性遗忘”提供了新视角。在传统机器学习的解释中当模型先学习识别“猫”再学习识别“狗”时“猫”的知识被新任务“覆盖删除”了。但在这篇论文所提出的框架下可以从另一种角度理解这一过程模型并非完全“忘记”了猫的知识而是在参数空间中仍然保留相关信息的情况下后续学习的表征在推理时占据了更强的激活优势从而在检索阶段抑制了旧任务的输出。这与键值记忆中“内容仍在但索引竞争导致无法顺利提取”的机制具有一定形式上的相似性。这种视角也与人类记忆中的一些现象形成呼应。例如在日常体验中我们常常会出现“明明知道但一时想不起来”的情况。这类现象通常被解释为信息并未丢失而是在提取过程中受到干扰或索引路径暂时失效。不过需要强调的是人类记忆系统依赖海马体与新皮层的协同结构而当前人工神经网络是单一参数系统两者在实现机制上并不相同。尽管如此这种“现象相似但机制不同”的对应关系为理解不同智能系统中的记忆可及性问题提供了一种统一的描述语言。在机器学习研究中类似的现象也在标准的连续学习continual learning设置中被反复观察。例如多任务学习MLP实验任务1识别MNIST手写数字0和1准确率达99%任务2识别FashionMNIST服饰T恤和裤子准确率达95%不做任何抗遗忘处理。结果表明任务2训练后任务1准确率从99%暴跌到9%复现“灾难性遗忘”。但推理时放大任务1的“键值对”分量模拟激光激活大脑沉默记忆无需重新训练准确率随放大系数回升最终回到99%。这类现象进一步提示“遗忘”在许多情况下更接近于检索竞争而非信息彻底消失。图 4连续学习中的遗忘与再激活 [5]。模型在先后学习任务1MNIST与任务2FashionMNIST后任务1性能显著下降但通过增强对应任务的激活路径可部分恢复其输出能力。这证明任务1的记忆没被擦掉只是被干扰成“沉默记忆”放大键值分量就能唤醒——和人类的遗忘与唤醒逻辑完全一致。五、结语人工与自然智能的“记忆共鸣”这篇论文的核心贡献并不在于提出某种新的工程方法而在于提供了一种统一的解释框架——用键值记忆的视角将脑科学、认知心理学与机器学习中的记忆机制联系起来使“信息如何被存储与检索”这一问题可以在同一抽象层面被讨论。需要指出的是键值记忆仍是一种计算层面的建模工具更适合作为解释框架而非对大脑机制的最终定论。大脑记忆系统涉及多脑区协同与多尺度动态过程其复杂性远超过简单的“键—值”二分结构。因此这一框架的意义不在于宣称“大脑等同于某种计算模型”而在于提供了一种跨领域可对话的概念语言使不同学科能够在同一抽象层面讨论记忆问题。在这一框架下一些现象获得了更统一的理解无论是人类记忆中的“暂时想不起来”还是机器学习中的灾难性遗忘都可以被看作是检索过程受阻或竞争增强的结果而非信息完全消失。这一视角也为人工智能提供了启发通过引入类似“索引与内容分离”的结构设计或增强特定路径的选择性激活有望提升模型在连续学习中的稳定性。从更宏观来看这种跨领域对照并不是结论而是一种起点。它提示我们当人工智能与神经科学在同一概念框架下对齐时既可能加深对大脑的理解也可能推动更具持续学习能力的人工系统设计。感兴趣可查看论文官方代码仓库https://github.com/kazuki-irie/kv-memory-brain亲身体验键值记忆的魅力——了解AI的记忆逻辑也是在了解我们自己的大脑。参考资料[1]McClelland, J.L., McNaughton, B.L., and O’Reilly, R.C. (1995). Why there are complementary learning systems in the hippocampus and neocortex: insights from the successes and failures of connectionist models of learning and memory. Psychol. Rev. 102, 419–457. https://doi.org/10. 1037/0033-295X.102.3.419.[2]Wiltgen, B.J., Zhou, M., Cai, Y., Balaji, J., Karlsson, M.G., Parivash, S.N., Li, W., and Silva, A.J. (2010). The hippocampus plays a selective role in the retrieval of detailed contextual memories. Curr. Biol. 20, 13361344. https://doi.org/10.1016/j.cub.2010.06.068[3]Chanales, A.J.H., Oza, A., Favila, S.E., and Kuhl, B.A. (2017). Overlap among spatial memories triggers repulsion of hippocampal representations. Curr. Biol. 27, 2307–2317.e5. https://doi.org/10.1016/j.cub.2017. 06.057.[4]Gutiérrez B J, Shu Y, Gu Y, et al. HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models[J]. arXiv preprint arXiv:2405.14831, 2025.[5]Gershman et al., Key-value memory in the brain, Neuron (2025), https://doi.org/10.1016/j.neuron.2025.02.029[6]Berens, S.C., Richards, B.A., and Horner, A.J. (2020). Dissociating memory accessibility and precision in forgetting. Nat. Hum. Behav. 4, 866–877. https://doi.org/10.1038/s41562-020-0888-8.[7]Wiltgen, B.J., Zhou, M., Cai, Y., Balaji, J., Karlsson, M.G., Parivash, S.N., Li, W., and Silva, A.J. (2010). The hippocampus plays a selective role in the retrieval of detailed contextual memories. Curr. Biol. 20, 13361344. https://doi.org/10.1016/j.cub.2010.06.068[8]Chanales, A.J.H., Oza, A., Favila, S.E., and Kuhl, B.A. (2017). Overlap among spatial memories triggers repulsion of hippocampal representations. Curr. Biol. 27, 2307–2317.e5. https://doi.org/10.1016/j.cub.2017. 06.057.[9]Berens, S.C., Richards, B.A., and Horner, A.J. (2020). Dissociating memory accessibility and precision in forgetting. Nat. Hum. Behav. 4, 866–877. https://doi.org/10.1038/s41562-020-0888-8.作者贾梓杏 中山大学物理与天文学院CIBR吉妮实验室实习生审核张江 北京师范大学系统科学学院教授出品中国科协科普部监制中国科学技术出版社有限公司、北京中科星河文化传媒有限公司阅读最新前沿科技趋势报告请访问21世纪关键技术研究院的“未来知识库”未来知识库是“21世纪关键技术研究院”建立的在线知识库平台收藏的资料范围包括人工智能、脑科学、互联网、超级智能数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告加入未来知识库全部资料免费阅读和下载牛津未来研究院 《将人工智能安全视为全球公共产品的影响、挑战与研究重点》麦肯锡超级智能机构赋能人们释放人工智能的全部潜力AAAI 2025 关于人工智能研究未来研究报告斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页壳牌2025 能源安全远景报告能源与人工智能57 页盖洛普 牛津幸福研究中心2025 年世界幸福报告260 页Schwab 2025 未来共生以集体社会创新破解重大社会挑战研究报告36 页IMD2024 年全球数字竞争力排名报告跨越数字鸿沟人才培养与数字法治是关键214 页DS 系列专题DeepSeek 技术溯源及前沿探索50 页 ppt联合国人居署2024 全球城市负责任人工智能评估报告利用 AI 构建以人为本的智慧城市86 页TechUK2025 全球复杂多变背景下的英国科技产业战略韧性与增长路径研究报告52 页NAVEX Global2024 年十大风险与合规趋势报告42 页《具身物理交互在机器人 - 机器人及机器人 - 人协作中的应用》122 页2025 - 2035 年人形机器人发展趋势报告 53 页Evaluate Pharma2024 年全球生物制药行业展望报告增长驱动力分析29 页【AAAI2025 教程】基础模型与具身智能体的交汇350 页 pptTracxn2025 全球飞行汽车行业市场研究报告45 页谷歌2024 人工智能短跑选手AI Sprinters捕捉新兴市场 AI 经济机遇报告39 页【斯坦福博士论文】构建类人化具身智能体从人类行为中学习《基于传感器的机器学习车辆分类》最新 170 页美国安全与新兴技术中心2025 CSET 对美国人工智能行动计划的建议18 页罗兰贝格2024 人形机器人的崛起从科幻到现实如何参与潜在变革研究报告11 页兰德公司2025 从研究到现实NHS 的研究和创新是实现十年计划的关键报告209 页康桥汇世Cambridge Associates2025 年全球经济展望报告44 页国际能源署2025 迈向核能新时代麦肯锡人工智能现状组织如何重塑自身以获取价值威立Wiley2025 全球科研人员人工智能研究报告38 页牛津经济研究院2025 TikTok 对美国就业的量化影响研究报告470 万岗位14 页国际能源署IEA能效 2024 研究报告127 页Workday 2025 发挥人类潜能人工智能AI技能革命研究报告20 页CertiKHack3D2024 年 Web3.0 安全报告28 页世界经济论坛工业制造中的前沿技术人工智能代理的崛起》报告迈向推理时代大型语言模型的长链推理研究综述波士顿咨询2025 亚太地区生成式 AI 的崛起研究报告从技术追赶者到全球领导者的跨越15 页安联Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告33 页IMT2025 具身智能Embodied AI概念、核心要素及未来进展趋势与挑战研究报告25 页IEEE2025 具身智能Embodied AI综述从模拟器到研究任务的调查分析报告15 页CCAV2025 当 AI 接管方向盘自动驾驶场景下的人机交互认知重构、变革及对策研究报告124 页《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新 132 页《面向科学发现的智能体人工智能进展、挑战与未来方向综述》全国机器人标准化技术委员会人形机器人标准化白皮书2024 版96 页美国国家科学委员会NSB2024 年研究与发展 - 美国趋势及国际比较51 页艾昆纬IQVIA2025 骨科手术机器人技术的崛起白皮书创新及未来方向17 页NPLBeauhurst2025 英国量子产业洞察报告私人和公共投资的作用25 页IEA PVPS2024 光伏系统经济与技术关键绩效指标KPI使用最佳实践指南65 页AGI 智能时代2025 让 DeepSeek 更有趣更有深度的思考研究分析报告24 页2025 军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告37 页华为2025 鸿蒙生态应用开发白皮书133 页《超级智能战略研究报告》中美技术差距分析报告 2025欧洲量子产业联盟QuIC2024 年全球量子技术专利态势分析白皮书34 页美国能源部2021 超级高铁技术Hyperloop对电网和交通能源的影响研究报告60 页罗马大学2025 超级高铁Hyperloop第五种新型交通方式 - 技术研发进展、优势及局限性研究报告72 页兰德公司2025 灾难性网络风险保险研究报告市场趋势与政策选择93 页GTI2024 先进感知技术白皮书36 页AAAI2025 人工智能研究的未来报告17 大关键议题88 页安联 Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告威达信2025 全球洪水风险研究报告现状、趋势及应对措施22 页兰德公司迈向人工智能治理研究报告2024EqualAI 峰会洞察及建议19 页哈佛商业评论2025 人工智能时代下的现代软件开发实践报告12 页德安华全球航空航天、国防及政府服务研究报告2024 年回顾及 2025 年展望27 页奥雅纳2024 塑造超级高铁Hyperloop的未来监管如何推动发展与创新研究报告28 页HSOAC2025 美国新兴技术与风险评估报告太空领域和关键基础设施24 页Dealroom2025 欧洲经济与科技创新发展态势、挑战及策略研究报告76 页《无人机辅助的天空地一体化网络学习算法技术综述》谷歌云Google Cloud2025 年 AI 商业趋势白皮书49 页《新兴技术与风险分析太空领域与关键基础设施》最新报告150 页《DeepSeek 大模型生态报告》军事人工智能行业研究报告技术奇点驱动应用加速智能化重塑现代战争形态 - 25030940 页真格基金2024 美国独角兽观察报告56 页璞跃Plug and Play2025 未来商业研究报告六大趋势分析67 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页未来今日研究所 2025 年科技趋势报告第 18 版 1000 页模拟真实世界多模态生成模型的统一综述中国信息协会低空经济分会低空经济发展报告2024 - 2025117 页浙江大学2025 语言解码双生花人类经验与 AI 算法的镜像之旅42 页人形机器人行业由 “外” 到 “内” 智能革命 - 25030651 页大成2025 年全球人工智能趋势报告关键法律问题28 页北京大学2025 年 DeepSeek 原理和落地应用报告57 页欧盟委员会 人工智能与未来工作研究报告加州大学伯克利分校面向科学发现的多模态基础模型在化学、材料和生物学中的应用电子行业从柔性传感到人形机器人触觉革命 - 25022635 页RT 轨道交通2024 年中国城市轨道交通市场数据报告188 页FastMoss2024 年度 TikTok 生态发展白皮书122 页Check Point2025 年网络安全报告 - 主要威胁、新兴趋势和 CISO 建议57 页【AAAI2025 教程】评估大型语言模型挑战与方法199 页 ppt《21 世纪美国的主导地位核聚变》最新报告沃尔特基金会Volta Foundation2024 年全球电池行业年度报告518 页斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页国际科学理事会2025 为人工智能做好国家研究生态系统的准备 - 2025 年战略与进展报告英文版118 页光子盒2025 全球量子计算产业发展展望报告184 页奥纬论坛2025 塑造未来的城市研究报告全球 1500 个城市的商业吸引力指数排名124 页Future Matters2024 新兴技术与经济韧性日本未来发展路径前瞻报告17 页《人类与人工智能协作的科学与艺术》284 页博士论文《论多智能体决策的复杂性从博弈学习到部分监控》115 页《2025 年技术展望》56 页 slides大语言模型在多智能体自动驾驶系统中的应用近期进展综述【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用皮尤研究中心2024 美国民众对气候变化及应对政策的态度调研报告气候政策对美国经济影响的多元观点审视28 页空间计算行业深度发展趋势、关键技术、行业应用及相关公司深度梳理 - 25022433 页Gartner2025 网络安全中的 AI明确战略方向研究报告16 页北京大学2025 年 DeepSeek 系列报告 - 提示词工程和落地场景86 页北京大学2025 年 DeepSeek 系列报告 - DeepSeek 与 AIGC 应用99 页CIC 工信安全2024 全球人工智能立法的主要模式、各国实践及发展趋势研究报告42 页中科闻歌2025 年人工智能技术发展与应用探索报告61 页AGI 智能时代2025 年 Grok - 3 大模型技术突破与未来展望报告28 页上下滑动查看更多
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2616513.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!