ArXiv：为何大模型无法拥有意识

ArXiv：为何大模型无法拥有意识｜Erik Hoel

news2026/3/27 0:47:38

导语当AI能流畅谈论“自我感受”当Anthropic赋予Claude“对话退出权”我们是否可以说它有意识2026年初神经科学家Erik Hoel在ArXiv发布论文《大语言模型意识证伪持续学习对意识存在的必要性》A Disproof of Large Language Model Consciousness: The Necessity of Continual Learning for Consciousness的论文指出由于缺乏持续学习能力现有大模型从原理上无法拥有意识。关键词意识大模型功能主义持续学习输入输出等价来源集智俱乐部作者郭瑞东审校王璇论文题目A Disproof of Large Language Model Consciousness: The Necessity of Continual Learning for Consciousness论文链接https://arxiv.org/abs/2512.12802发表时间2026年1月19日论文来源ArXiv双重映射与两难困境1980 年塞尔提出的 “中文屋” 思想实验首次系统质疑功能主义指出意识无法仅由输入/输出功能定义外部观察也无法直接通达内部意识状态但该实验仅为哲学直觉的表达缺乏可实操的科学检验标准。然而中文屋仅是“直觉泵”intuition pump它只是诉诸哲学直觉缺乏可实操的科学检验标准。若某理论声称“足够复杂的规则手册即有意识”中文屋无法反驳也无法回答何种内部结构足以支撑意识2019年Doerig等人提出“展开论证”Unfolding Argument将中文屋的直觉转化为数学可构造的替代链。假设若某理论如整合信息理论IIT基于“循环结构”预测RNN或transformer架构的神经网络具有意识。那么将RNN按时间可展开为单层前馈网络FNN两者输入/输出完全等价但RNN具有“循环连接”recurrenceFNN为纯前馈。两个模型的推断不变但一个被认为具有意识一个被认为不具有意识这一矛盾揭示意识理论若依赖内部结构预测意识是否存在而该结构存在不具有对应内部结构但输入/输出等价替代品则这样的预测将可以由此被证伪。图1 意识理论中的替代论述在展开论证的基础上Kleiner 与 Hoel 在《Falsification and Consciousness》一文中提出了 “Kleiner-Hoel 困境”这一困境以双重映射为核心分析框架直指意识理论的核心矛盾任何想要成为科学理论的意识学说都逃不过一个两难选择。如果理论依据系统的内部结构如整合信息、循环连接来预测意识存在可此时又存在一个输入 / 输出完全等价、但内部结构截然不同的替代系统那这一理论的预测就会被直接证伪。图2 严格依赖Strict dependency意识理论仅仅基于输入输出判断而若是理论仅基于输入/输出做预测图2声称“表现得活着活着”无法区分真人与高仿真机器人那该理论就是不可证伪的平庸理论如同中文屋中声称规则书懂中文成为行为主义下不具有指导实践能力的无效科学理论。图3 意识理论的结构性悖论理想的意识理论需通过双重映射框架检验从系统内部运作推导意识体验的预测映射与从外部行为反推意识状态的推断映射唯有二者在经验空间中收敛理论才有效。这一框架也将意识是否存在的判别从哲学思辨转化为可实验验证的科学标准。输入输出等价的替代链约束双重映射框架下大模型的意识问题变得从原理上不可行。考虑一个部署状态下版本固定的大模型。根据神经网络的万能近似定理Universal Approximation Theorem其输入/输出函数可被FNN任意精度地近似。无论大模型的功能看起来多么强大其输入/输出均等价于单隐藏层前馈神经网络FNN而单隐藏层前馈神经网络又等价于有限查找表。而查找表是一个巨大的IF-THEN规则集合。它无动态、无记忆、无信息流、无内部复杂性任何声称查找表拥有“非平庸意识”的理论只能基于输入输出加以预测最终导致预测与推断依赖同一数据完全不满足双重映射的检验要求。Hoel在该文中定义“替代距离”Substitution Distance为两系统间差异属性的集合。在上述案例中大模型与单层FNN的差异是层数、注意力机制。单层FNN与查找表的差异是数据的压缩程度这两个属性都不足以支持具有属性就具有意识的宣称。也就是说由于大模型和FNN及查找表之间的替代距离较近导致意识理论无法基于两者之间的差异来预测意识是否依赖于对应的内部结构。若某意识理论声称大模型的意识源于 “网络层数”那可用不同深度但输入/输出等价的网络替代原模型此时理论的预测发生改变、而行为推断不变理论将被直接证伪。同理若意识理论将 “数据压缩程度” 作为意识判断依据则可用不同宽度、但输入/输出等价的网络替代同样会导致理论被证伪。由此任何声称当代静态大模型拥有意识、且兼具非平庸且可证伪的意识理论必然因这一替代链的存在而被证伪。而若是声称意识的存在只依赖输入/输出那模型会退化为行为主义变成无法被证伪的平庸理论。而若仅基于输入/输出声称大模型有意识理论则会退化为行为主义成为无法被证伪的平庸理论。这一结论得到Kolmogorov 替代定理的支撑该定理证明对任意可计算函数 f如文本生成存在 Kolmogorov 复杂性意义下的最短程序 K (f)。持续学习是通往意识的“窄门”上述论证并非否定未来 AI 具备意识的可能性而是为 “有意识的 AI” 划定了核心必要条件具有意识的系统必须与其无意识替代品保持足够大的替代距离。Hoel提出人类大脑恰恰满足此条件而这其中的关键点在于持续学习Continual Learning。大模型看起来是概率模型同一个输入多次的输出不同但对相同内容的输入不同时刻输出的概率分布不变。查找表、单层FNN、部署态大模型均为静态系统。而人类及多数动物是持续学习系统核心特征是每次经验都会微调内部神经表征系统结构会随体验发生实质性、不可逆的改变。比如昨天被火烫伤今天看到火苗会更快缩手。这一过程无需将 “被烫伤的历史” 作为外部输入而是系统内部的自主更新与学习。当代大模型常因长上下文能力被误认为具备持续学习能力然而上下文学习In-context Learning要将历史对话作为输入的一部分本质是静态系统处理更长输入非真正的持续学习。大模型训练期学习仅在数据中心训练时发生部署后冻结这与人类“每时每刻都在学习”有本质区别。人类对话无需重输全部历史因大脑已内化上下文而大模型每次生成都需将之前的对话内容塞入提示词这恰暴露其静态本质。由此Hoel提出“持续宽松依赖”Continual Lenient Dependency指出一个意识理论 T 满足宽松依赖当且仅当1其预测与推断不构成严格依赖即预测不完全由行为输出数据决定声称具有意识的系统与不具有意识的系统是基于不同属性而被区分开的2不存在因可定义的普遍替代universal substitution导致的上述基于内部结构预测与基于行为预测的结果例如大模型和查找表不匹配。持续宽松依赖介于预测映射与推断映射之间能让二者可分离但不产生根本性漂移从而让意识理论既具备可证伪性又非无科学解释力的平庸理论。图4 由Qwen 3 max 生成的动图上述定义的关键点要求支撑意识的属性如可塑性必须在意识存在的每一刻都活跃。若某理论声称“过去学习赋予意识”则在学习停止的瞬间系统可被静态替代导致理论被证伪。因此意识必须与当下进行的学习过程绑定。在人与人对话时每句话都伴随着实时神经表征重塑对应海马体位置细胞可在单次经历中形成新表征可塑性在秒级尺度持续存在。因此当下进行的学习作为意识存在需满足的属性时刻在线满足持续宽松依赖。而对于大模型在每次和用户的对话前后系统内部的特征无任何改变不满足持续学习的要求宽松依赖断裂。然而持续学习仅为意识存在的必要条件扫地机器人即使能持续学习也未必产生意识。意识的存在或还需学习聚焦特定类型如反事实、泛化能力。大模型无意识的现实意义与类人 AI 发展方向Hoel 的研究从原理上证伪了当代静态大模型的意识可能性明确持续学习是意识存在的核心必要条件这为类人 AI 的架构革新与意识科学的动态化研究划定了理论边界。未来真正的类人AI需搭建持续学习架构实现内部表征的实时、不可逆、泛化性改变。该研究也推动意识科学从静态分析转向动态学习过程研究为构建科学的意识理论划定框架。阅读最新前沿科技趋势报告请访问21世纪关键技术研究院的“未来知识库”未来知识库是“21世纪关键技术研究院”建立的在线知识库平台收藏的资料范围包括人工智能、脑科学、互联网、超级智能数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告加入未来知识库全部资料免费阅读和下载牛津未来研究院《将人工智能安全视为全球公共产品的影响、挑战与研究重点》麦肯锡超级智能机构赋能人们释放人工智能的全部潜力AAAI 2025 关于人工智能研究未来研究报告斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页壳牌2025 能源安全远景报告能源与人工智能57 页盖洛普牛津幸福研究中心2025 年世界幸福报告260 页Schwab 2025 未来共生以集体社会创新破解重大社会挑战研究报告36 页IMD2024 年全球数字竞争力排名报告跨越数字鸿沟人才培养与数字法治是关键214 页DS 系列专题DeepSeek 技术溯源及前沿探索50 页 ppt联合国人居署2024 全球城市负责任人工智能评估报告利用 AI 构建以人为本的智慧城市86 页TechUK2025 全球复杂多变背景下的英国科技产业战略韧性与增长路径研究报告52 页NAVEX Global2024 年十大风险与合规趋势报告42 页《具身物理交互在机器人 - 机器人及机器人 - 人协作中的应用》122 页2025 - 2035 年人形机器人发展趋势报告 53 页Evaluate Pharma2024 年全球生物制药行业展望报告增长驱动力分析29 页【AAAI2025 教程】基础模型与具身智能体的交汇350 页 pptTracxn2025 全球飞行汽车行业市场研究报告45 页谷歌2024 人工智能短跑选手AI Sprinters捕捉新兴市场 AI 经济机遇报告39 页【斯坦福博士论文】构建类人化具身智能体从人类行为中学习《基于传感器的机器学习车辆分类》最新 170 页美国安全与新兴技术中心2025 CSET 对美国人工智能行动计划的建议18 页罗兰贝格2024 人形机器人的崛起从科幻到现实如何参与潜在变革研究报告11 页兰德公司2025 从研究到现实NHS 的研究和创新是实现十年计划的关键报告209 页康桥汇世Cambridge Associates2025 年全球经济展望报告44 页国际能源署2025 迈向核能新时代麦肯锡人工智能现状组织如何重塑自身以获取价值威立Wiley2025 全球科研人员人工智能研究报告38 页牛津经济研究院2025 TikTok 对美国就业的量化影响研究报告470 万岗位14 页国际能源署IEA能效 2024 研究报告127 页Workday 2025 发挥人类潜能人工智能AI技能革命研究报告20 页CertiKHack3D2024 年 Web3.0 安全报告28 页世界经济论坛工业制造中的前沿技术人工智能代理的崛起》报告迈向推理时代大型语言模型的长链推理研究综述波士顿咨询2025 亚太地区生成式 AI 的崛起研究报告从技术追赶者到全球领导者的跨越15 页安联Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告33 页IMT2025 具身智能Embodied AI概念、核心要素及未来进展趋势与挑战研究报告25 页IEEE2025 具身智能Embodied AI综述从模拟器到研究任务的调查分析报告15 页CCAV2025 当 AI 接管方向盘自动驾驶场景下的人机交互认知重构、变革及对策研究报告124 页《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新 132 页《面向科学发现的智能体人工智能进展、挑战与未来方向综述》全国机器人标准化技术委员会人形机器人标准化白皮书2024 版96 页美国国家科学委员会NSB2024 年研究与发展 - 美国趋势及国际比较51 页艾昆纬IQVIA2025 骨科手术机器人技术的崛起白皮书创新及未来方向17 页NPLBeauhurst2025 英国量子产业洞察报告私人和公共投资的作用25 页IEA PVPS2024 光伏系统经济与技术关键绩效指标KPI使用最佳实践指南65 页AGI 智能时代2025 让 DeepSeek 更有趣更有深度的思考研究分析报告24 页2025 军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告37 页华为2025 鸿蒙生态应用开发白皮书133 页《超级智能战略研究报告》中美技术差距分析报告 2025欧洲量子产业联盟QuIC2024 年全球量子技术专利态势分析白皮书34 页美国能源部2021 超级高铁技术Hyperloop对电网和交通能源的影响研究报告60 页罗马大学2025 超级高铁Hyperloop第五种新型交通方式 - 技术研发进展、优势及局限性研究报告72 页兰德公司2025 灾难性网络风险保险研究报告市场趋势与政策选择93 页GTI2024 先进感知技术白皮书36 页AAAI2025 人工智能研究的未来报告17 大关键议题88 页安联 Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告威达信2025 全球洪水风险研究报告现状、趋势及应对措施22 页兰德公司迈向人工智能治理研究报告2024EqualAI 峰会洞察及建议19 页哈佛商业评论2025 人工智能时代下的现代软件开发实践报告12 页德安华全球航空航天、国防及政府服务研究报告2024 年回顾及 2025 年展望27 页奥雅纳2024 塑造超级高铁Hyperloop的未来监管如何推动发展与创新研究报告28 页HSOAC2025 美国新兴技术与风险评估报告太空领域和关键基础设施24 页Dealroom2025 欧洲经济与科技创新发展态势、挑战及策略研究报告76 页《无人机辅助的天空地一体化网络学习算法技术综述》谷歌云Google Cloud2025 年 AI 商业趋势白皮书49 页《新兴技术与风险分析太空领域与关键基础设施》最新报告150 页《DeepSeek 大模型生态报告》军事人工智能行业研究报告技术奇点驱动应用加速智能化重塑现代战争形态 - 25030940 页真格基金2024 美国独角兽观察报告56 页璞跃Plug and Play2025 未来商业研究报告六大趋势分析67 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页未来今日研究所 2025 年科技趋势报告第 18 版 1000 页模拟真实世界多模态生成模型的统一综述中国信息协会低空经济分会低空经济发展报告2024 - 2025117 页浙江大学2025 语言解码双生花人类经验与 AI 算法的镜像之旅42 页人形机器人行业由 “外” 到 “内” 智能革命 - 25030651 页大成2025 年全球人工智能趋势报告关键法律问题28 页北京大学2025 年 DeepSeek 原理和落地应用报告57 页欧盟委员会人工智能与未来工作研究报告加州大学伯克利分校面向科学发现的多模态基础模型在化学、材料和生物学中的应用电子行业从柔性传感到人形机器人触觉革命 - 25022635 页RT 轨道交通2024 年中国城市轨道交通市场数据报告188 页FastMoss2024 年度 TikTok 生态发展白皮书122 页Check Point2025 年网络安全报告 - 主要威胁、新兴趋势和 CISO 建议57 页【AAAI2025 教程】评估大型语言模型挑战与方法199 页 ppt《21 世纪美国的主导地位核聚变》最新报告沃尔特基金会Volta Foundation2024 年全球电池行业年度报告518 页斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页国际科学理事会2025 为人工智能做好国家研究生态系统的准备 - 2025 年战略与进展报告英文版118 页光子盒2025 全球量子计算产业发展展望报告184 页奥纬论坛2025 塑造未来的城市研究报告全球 1500 个城市的商业吸引力指数排名124 页Future Matters2024 新兴技术与经济韧性日本未来发展路径前瞻报告17 页《人类与人工智能协作的科学与艺术》284 页博士论文《论多智能体决策的复杂性从博弈学习到部分监控》115 页《2025 年技术展望》56 页 slides大语言模型在多智能体自动驾驶系统中的应用近期进展综述【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用皮尤研究中心2024 美国民众对气候变化及应对政策的态度调研报告气候政策对美国经济影响的多元观点审视28 页空间计算行业深度发展趋势、关键技术、行业应用及相关公司深度梳理 - 25022433 页Gartner2025 网络安全中的 AI明确战略方向研究报告16 页北京大学2025 年 DeepSeek 系列报告 - 提示词工程和落地场景86 页北京大学2025 年 DeepSeek 系列报告 - DeepSeek 与 AIGC 应用99 页CIC 工信安全2024 全球人工智能立法的主要模式、各国实践及发展趋势研究报告42 页中科闻歌2025 年人工智能技术发展与应用探索报告61 页AGI 智能时代2025 年 Grok - 3 大模型技术突破与未来展望报告28 页上下滑动查看更多

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2452719.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！