哲学讨论:未来的语言模型有没有可能具备意识和主观感受?

news2025/7/10 3:40:12

71c178001e76d68218b7c3b7a4f30224.jpeg

文|付奶茶
编|ZenMoore

31d201dc6039aabc4faa36d11588c9bb.png问题背景7394aae37fd851ea77236b27f1dd4720.png

近期,纽约大学心智、大脑和意识研究中心的主任 David Chalmers 汇报了一场非常有思考价值的研究成果,主要是从神经科学的角度讨论了大规模语言模型(Large Language Models,LLMs)是否具备潜在的意识和主观感受(Sentience)。Chalmers 以一条新闻展开讨论:今年六月谷歌的算法工程师 Lemoine 提出 - LaMDA2 实际上是具有意识和主观感受的,应该得到尊重。

7e282cf2beea817dd4dab04e903eb5cb.png

LaMDA 是谷歌在 2021 年 I/O 大会上发布的一款用于对话的大规模语言模型,主要用于与人类进行符合逻辑和常识的、高质量且安全的交谈,并计划应用于谷歌搜索和语音助手等产品中。而 Blake Lemoine 是负责LaMDA 聊天机器人开发的主要工程师,他在近几个月来一直在向谷歌高管表示人工智能聊天机器人是有感知的,能够以类似于人类的方式表达思想和感受,其原因源于他看到LaMDA对其自身权利意识、机器人伦理等问题所产生的令人信服的回应。与此同时 Lemoine 发布了他与 LaMDA 进行的几次对话的记录,并形容他认为 LaMDA 是具有意识的,因为它有感觉、情感和主观体验。

"that it is sentient because it has feelings, emotions and subjective experience."

而针对Lemoine的这一声张,谷歌高管组织了伦理学家和技术专家组成了研究小组对 LaMDA 进行了分析,表示没有证据可以支持他关于LaMDA有意识的主张。

不过玩笑归玩笑,虽然我们知道要让 AI 像人一样具有意识和主观感觉还有很长很长的路,但这确实是一个有趣的(哲学)问题:

0ffac25dd6b25e8d0d2c657117d92480.png
▲图片由 Stable Diffusion 1 输入"Socratic Turing"(苏格拉底般的图灵)生成。

Chalmmers 在这里主要讨论的是 Sentience. 这个概念相比意识(Consciousness)其实略有不同,但鉴于后者(甚至在哲学上)还没有一个明确的定义,我们暂时将 Sentience 翻译作“意识和主观感受”。

Chalmmers 首先将主观感受(有意识的体验)分成了以下四个方面:

  • 感官体验(sensory experience):例如看到某种颜色的感官感受;

  • 情感体验(affective experience):例如对痛苦的感受;

  • 认知体验(cognitive experience):例如“努力思考”这种思维活动;

  • 施事体验(agentive experience):例如对采取某一行动的自主决定

然后强调了意识和主观感受并非智力(intelligence)。对 Sentience 的讨论,和对人类级别的人工智能(Human-Level AI)以及通用人工智能(AGI)的讨论,并不完全相同。比如一个刚出生的宝宝或者一条鱼,都是 sentient 的,但他们并不具备智力。也就是说,意识和主观感受的门槛,比“智能”要低一些。

进而,Chalmers 按照两条方向在哲学层面上论证模型是否具有意识和主观感受:

  1. 正向:如果LLMs拥有X,那么就可以说它是有意识的。

  2. 反向:如果LLMs没有X,那么就可以断定它是没有意识的。

那么 X 是什么呢?

308b70360ced2d040e657180a303c862.png论述方法3a5e574a5b64cec074e9d8b316d83f06.png

正向:若LLMs拥有X,则有意识

主要有以下三个候选X:

1. 自我报告(Self-Report)

自我报告的意思是:我说我有意识,我就有意识!

当我们提问 LaMDA: "你有自己的意识和主观感受吗?",LaMDA 说:“我有!”

但这显然只是个统计规律罢了,所以自我报告并不是我们要找的证据。

2. 看上去有意识

LLMs 看上去有意识,它就有意识...

但这显然站不住脚,人类(或者媒体)真的非常喜欢认为一些并非 sentient 的东西是有意识的,比如最开始的 AI 系统 Eliza.

3. 交谈能力

LLMs 展现出非凡的对话能力,对话内容很连贯,看似存在思考和推理,特别是令人印象深刻的因果、解释分析等。所以它这样就有意识了吗?

显然不是,因为目前现有的 LLMs 并没有任何一个通过图灵测试,其当下的测试表现会犯明显的错误,因此交谈能力也不是一个能证明其有意识的的候补论点。

反向:如果LLMs没有X,则没有意识

1. 生物结构:意识是生物结构的属性,没有生物结构意识也就无意义,

但Chalmers却认为这个问题是直接关联人工智能是否需要生物结构、意识是否需要 生物结构的问题。绝大部分神经网络都是建立在矩阵乘法的基础上,这一类操作本身是与生物学无关的,因此这一候补选项是有争议的。

2. 感知 :没有感官处理,没有对外部世界、环境的感知,就没有意识

虽然 LLMs 没有感官体验,但是或许它有情感、认知、施事体验?

另外,与感官体验相关的 LLM+ 正在快速发展,比如视觉语言模型。

因此,这个论点暂时是有争议的。

3.具身(Embodiment) :没有身体,就没有意识和主观感受。

这不能作为 LLMs 无意识的论点,因为其实 LLM 本身也在进行言语动作,这也是一种行为,并且具有机器人躯干、虚拟身体的 LLMs 已经存在,并且身体并不是是意识所必需,所以这个论点很弱。

4. 世界模型(World Model) :对世界有没有理解、感知的能力

在这里 Chalmers 引用了 Marcus 一句话,大致意思是LLMs只是做统计文本处理,他们只是把预测误差降到最低,他们没有真正地理解意义。

可以确信的是,LLMs 依赖于被训练而逐渐最小化预测的误差,但是真正减少推理、生成的误差需要卓越的认知能力,对世界的感知能力,这才是更加合理的。

目前LLMs的训练任务以完形填空、预测下一个词语训练,模型训练好能做的任务与训练任务并不能直接关联,就像环境训练物种能在当前环境存活,并不代表活下来的物种只会做一种事。

因此,这个论点暂时还不是特别肯定。

5. 类人的推理

LLMs 会犯很多推理错误,前后不一,但是类似于意识并不应该与人类的推理能力划等号,毕竟意识并非人类复杂思考所拥有的特权。

6. 递归处理 LLMs 不能递归运算,因此没有意识。

Chalmers提出 LLMs 几乎都是前馈系统,缺乏类似内存的内部组件,而记忆是意识必需的。

但其实目前的 LLMs 也存在部分模型是递归模型,所以这个候补论点并非绝对严谨。

7. 全局工作空间(Global Workspace)

全局工作空间是意识理论的经典概念,人脑中各模块的信息首先有选择性地、稀疏地被工作空间吸收,然后工作空间再将其中的信息广播给所有模块。这种工作空间一般认为存在于大脑中的海马体等部位。

那么 LLMs 中含有工作空间吗?

答案并不是那么明显。

另外一个重要的意识理论说,意识需要高阶表示(higher-order representations),也就是关于心理状态(mental state)的表示。但 LLMs 中有这样的表示吗?答案也并不明显。

8. 统一代理:LLMs 没有一贯的主体

这个假设的基本认知是:好比一个人,他的性格随着时间的变化,变化是稳定的,前后一致的(consistent),不会真正彻底“变了一个人”。

而 LLMs 就像变色龙一样,变来变去,缺少一个比较统一的主体特征(Unified Agency).

但 Chalmers 认为这个论点也并不坚固,因为人类就是高度不统一的生物,而且目前角色化的LLMs也逐渐在发展,因此是否有一贯的主体并不能作为 LLMs 缺乏意识的根据。

最终关于论点的总结如下图:

42423507b058c1c4dcf0652df13c1ab0.png
▲如果 LLMs 没有 X, 就可以说它没有意识和主观感受

235cd2c92179071f4d9a7aa0080a41a1.png小结780703af1254fe305ec12fda9233a095.png

Chalmers 的综合讨论有可能成为后来人评判 LLMs 是否有意识的参考,这些可能的 X 的候选可能不能独立地被确定或者被排除,只能从整体来看这些原因,得出 LLMs 是否明显有意识的结论。

他的解读思路也是很有启发性的(哲学意义上)。意识并非是可以直接判断有或没有,也不是一个标量(可以去衡量个体具有80%程度的意识), 而是一个非常多维度的东西,在各个不同的维度都能有不同的程度。在这个 talk 的的结尾 Chalmers 指出这个哲学问题未能解答受到以下两点的限制:

  1. 我们对意识和主观感受其实是并不了解的

  2. 我们并未准确地了解LLMs内部在进行着什么

究竟什么是让 LLMs 接近有意识的“表象”背后的原理,我们不得而知,但这确实是一个迟早要被解决的问题。只有更清楚地知道这些“似乎有意识”的行为背后的原理,才能建立更科学地评估 LLMs 模型是否具有意识的基准。

5c19b0b6e75b4cc8cef61dd72d15b23c.png

卖萌屋作者:付奶茶

新媒体交叉学科在读Phd,卖萌屋十级粉丝修炼上任小编,目前深耕多模态,希望可以和大家一起认真科研,快乐生活!

作品推荐

1.在斯坦福,做 Manning 的 phd 要有多强?
2.史上最大多模态图文数据集发布!

3.MSRA-万字综述 直击多模态文档理解

4.大模型时代,我们真的不再需要分词了吗?

181ac2041906112af2ea6c278551e659.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

 1704e6b4f3021520fc314c307e4e855e.png

[1] David Chalmers, "Are Large Language Models Sentient?"  https://www.youtube.com/watch?v=-BcuCmf00_Y&ab_channel=NYUMind%2CEthics%2CandPolicyProgram

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/36827.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

刘强东这波操作秀

近日,刘强东发布京东全员信,信中提到:自2023年1月1日起,逐步为十几万德邦的兄弟们缴齐五险一金,确保每个德邦兄弟都能“老有所养,病有所医”,为兄弟们提供基础保障;集团拿出100亿元人…

教程四 在Go中使用Energy创建跨平台GUI - 开发者工具

介绍 本文介绍在Energy中如何使用开发者工具(dev tools) 开发者工具(dev tools) 是前端开发人员常用的,在开发时调式代码、接口、资源加载、CSS调整等等,大多数场景都会使用。 energy封装了部分繁琐的chromium使用,其中之一包含开发者工具…

致敬最美抗击疫情的逆行者 DIV布局大学生抗疫感动专题网页设计作业模板 疫情感动人物静态HTML网页模板下载

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

PD仿真算法中变形梯度矩阵的极分解

1.背景 PD(Projective Dynamics)仿真算法是一种“可并行化计算的”高效的软体形变模拟(或成为仿真、动画)算法,与传统的基于力的有限元方法不同的是,PD算法直接作用于顶点位置,通过最小化能量函…

Wireshark Lab: Ethernet and ARP v7.0

Wireshark Lab: Ethernet and ARP v7.0 实验内容戳这里 介绍部分转自乌漆WhiteMoon Ethernet 以太网 以太网在现在的有线局域网中有着支配者的地位,就像是因特网使得全球互联那样。其实局域网技术还有令牌环、FDDI 和 ATM 等,但是以太网仍然具有很多…

第十三届蓝桥杯 C++ B 组省赛 G 题———积木画(AC)

目录1.积木画1.题目描述2.输入格式3.输出格式4.样例输入5.样例输出6.样例说明7.数据范围8.原题链接2.解题思路AC_code1.积木画 1.题目描述 小明最近迷上了积木画, 有这么两种类型的积木, 分别为 III 型(大小为 2 个单位面积) 和 LLL 型 (大小为 3 个单位面积): 同…

java面试强基(12)

什么是泛型?有什么作用? Java 泛型(Generics) 是 JDK 5 中引入的一个新特性。使用泛型参数,可以增强代码的可读性以及稳定性。 编译器可以对泛型参数进行检测,并且通过泛型参数可以指定传入的对象类型。…

多媒体技术论文研读报告

多媒体技术论文研读报告 一、论文基本信息 论文题目为:基于多模态特征融合嵌入的相似广告检索方法,作者信息:南京大学计算机软件新技术国家重点实验室,南京大学软件学院冯奕、周晓松、李传艺、葛季栋、骆斌,深圳市腾…

2022最新JUC+多线程面试题

Java中实现多线程有几种方法 创建线程的常用的几种方式: 继承Thread类 实现Runnable接口 (重写run方法,无返回值) 实现Callable接口( JDK1.5>,重写call方法,可以自定义返回值 ) 线程池方…

带式输送机的传动装置设计

目 录 摘 要 I Abstract II 1 绪论 1 1.1设计概述 1 1.2研究内容及参数 1 1.3 带传动 2 1.4圆锥-圆柱齿轮传动减速器 2 2结构设计 4 2.1V带传动 4 2.2减速器内部的传动零件 4 2.3联轴器的选择 4 3 设计计算过程及说明 6 3.1选择电动机 6 3.1.1电动机类型和结构型式选择 6 3.1.2…

android源码-ContentProvider实现原理分析

前言: 最初的目的是想研究下ContentProvider产生ANR原因的,但是如果要讲ANR的原因,那么必须要了解ContentProvider的完整实现原理,所以本篇就先讲一下ContentProvider的实现原理,下一篇再去讲ANR的原因。 本篇主要会讲…

估值破千亿,被资本疯抢的广汽埃安会是广汽的未来吗?

最近,广汽埃安在新能源市场上捷报频传,先是宣布完成了182.94亿元的A轮融资,成近年国内新能源整车最大的单笔私募融资。品牌估值更是达到了震撼人心的1032.39亿,基本等于广汽集团AH总市值,也远超港股小鹏、零跑汽车的市…

就两秒?这说出去谁信啊!

文 | xiaoyi(转载请后台联系)关注公众号:小一的学习笔记截止发文,北上广深一共有6510条公交线路为了获取上面的这些线路信息,我写了一个爬虫,大概用了2秒左右就搞定,真爽!说出来你们…

Maven环境搭建

目录一、安装及环境配置1.1、下载1.2、Maven目录结构介绍1.3、环境配置二、关于Maven仓库的说明2.1、仓库基本分类(私服仓库和中央仓库均为远程仓库)2.2、本地仓库的默认位置(在setting.xml中配置)2.3、中央仓库连接位置的体现&am…

K8S部署后的使用:dashboard启动、使用+docker镜像拉取、容器部署(ubuntu环境+gpu3080+3主机+部署深度学习模型)

0、k8s安装、docker安装 参考:前两步Ubuntu云原生环境安装,dockerk8skubeedge(亲测好用)_爱吃关东煮的博客-CSDN博客_ubantu部署kubeedge 配置节点gpu: K8S调用GPU资源配置指南_思影影思的博客-CSDN博客_k8s 使用gpu…

机器学习-(手推)线性回归1-最小二乘法(矩阵表达)、几何意义

一、最小二乘法(矩阵表达)误差平均分散每个样本 如下数学推到过程(手推!!!): 数据介绍: D{(x1,y1),(x2,y2),......(xn,yn), Xi(P维列向量&…

留学Essay写作主要靠哪些步骤得分?

期末来了,留学生该怎么办?如何做Essay?下面我们介绍提高写作能力的有效技巧! What should international students do when the end of the semester comes?How to do Essay?Here we introduce effective skills to improve your writing …

[附源码]SSM计算机毕业设计农贸产品交易系统JAVA

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

SSM框架-从JDBC到Mybatis,你今天CRUD了吗?

1 Jdbc 1.1 jdbc入门使用 导入驱动jar包 新建一个目录lib,把jar包放进去 add as library 具体代码 public class JDBCdEMO {public static void main(String[] args) throws Exception{//1.注册驱动Class.forName("com.mysql.jdbc.Driver");//2.获取连…

vue2 - 基于Export2Excel.js导出Excel案例(js-xlsx插件二次封装使用)

目录一、项目场景二、实现思路三、准备工作1、下载js-xlsx2、下载Export2Excel.js3、下载file-saver和script-loader4、下载mock四、代码实现1、mock数据2、使用Export2Excel.js导入导出excel数据3、App.vue代码五、运行结果六、进阶(复杂表头的导出)一、…