大模型真的像人一样“思考”和“理解”吗?​

news2025/6/10 11:48:20

Yann LeCun 新研究的核心探讨:大语言模型(LLM)的“理解”和“思考”方式与人类认知的根本差异。

核心问题:大模型真的像人一样“思考”和“理解”吗?

人类的思考方式: 你的大脑是个超级整理师。面对海量信息(比如看到无数种鸟),它会自动把相似的东西归类(都叫“鸟类”),并且还能区分哪些是“典型代表”(比如知更鸟很“鸟样”),哪些不那么典型(比如企鹅虽然也是鸟,但不像“典型鸟”)。这种能力让我们既能高效处理信息,又能抓住微妙的细节和语境。

大模型(LLM)的“思考”方式: LLM 更像是一个超级文本统计员。它通过“啃”了网上天文数字的文本数据,学会了词语之间复杂的统计关联模式。它能把词语在数学空间里排布(词嵌入),让意思相近的词靠得近。但它是否真的“理解”这些词背后像人类一样的概念呢?LeCun 的新研究说:本质不同!

研究怎么证明的?用了信息论的“尺子”

研究者们搬来了信息论里的两把“尺子”:

  • 速率-失真理论: 衡量一个系统在“压缩信息”(省空间,减少废话)和“保留意义”(不失真,保持原意)之间如何取舍。
  • 信息瓶颈原理: 核心也是找到压缩信息和保留关键信息的最佳平衡点。

他们用这把“尺子”量了:

  • 人类数据: 经典的心理学实验数据,真实记录人类如何分类和判断典型性(比如为什么觉得知更鸟比企鹅更像鸟)。
  • 大模型数据: 分析了好几个主流大模型(BERT, Llama, Gemma, Qwen 等)的内部词嵌入结构。

发现了什么关键差异?三大核心结论

1. AI 会“分大类”,但不会“品细节”:

  • 好的一面: LLM 在大的分类任务上表现不错,能把“鸟”和“家具”分清楚。小模型(如 BERT)有时还比大模型分得好点。这说明 AI 能抓住一些宏观的、统计上的相似性。
  • 坏的一面: 但在判断“哪个更像典型代表”这种细微语义差别上,LLM 就懵了。它搞不懂为什么人类觉得“知更鸟”比“企鹅”更像鸟。这说明 AI 的“理解”是表面的、缺乏人类那种基于丰富经验和感官的细腻认知。

2. AI 和人类的“目标”背道而驰:

  • AI 是“极致压缩狂”: LLM 在内部处理信息时,首要目标是拼命压缩!它想把所有信息用最精简、最高效(信息论意义上)的方式表达,极力消除冗余。代价是牺牲了对细节、微妙含义和语境的敏感性。
  • 人类是“细节保留者”: 人脑的概念系统更注重适应性和丰富性。我们愿意多花点“内存”,保留更多细节和上下文信息,即使这样压缩效率低点也没关系。这让我们能灵活应对复杂多变的世界。

3. 模型越大,不一定越像人:

  • 研究发现,单纯把模型做得更大(堆参数),并不能让它变得更像人类那样思考。
  • 模型的结构和训练目标更重要: 比如 BERT(一种主要用于理解文本而非生成文本的模型)在某些任务上反而比一些更大的生成模型表现得在某些方面更接近人类的数据模式。这说明如何设计模型(架构和目标)比单纯追求规模更能影响它是否“类人”。

差异在哪?意味着什么?

差异本质: LLM 的“理解”是基于海量文本数据的统计模式学习和极致信息压缩。人类的认知则是基于多感官经验、形成有结构的概念(能分大类也能抓典型)、并保留丰富细节以适应环境。

为什么 LLM 对话流畅却不像人? LLM 的压缩能力让它能高效关联词语,生成流畅文本,但这建立在牺牲对细微语义、语境、真实世界经验的深度理解上。

对 AI 发展的启示:

  • 追求“智能”不能只靠堆数据和算力(更大更强),更要思考什么样的智能结构能更好地服务于人类需求。
  • 也许 AI 不必、也很难完全模仿人类思维。承认并利用这种差异,设计互补型的人机协作,可能是更有前景的方向。比如 AI 负责高效压缩、检索信息,人类负责理解深层含义、做出价值判断。

大模型能聊天,但它的“脑回路”和人类根本不一样!它擅长压缩信息找关联,却不懂为什么知更鸟比企鹅更“鸟样”。想让它更“聪明”,光堆参数不行,得改变设计思路,而且不必强求它像人。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2406580.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Element-Plus:popconfirm与tooltip一起使用不生效?

你们好&#xff0c;我是金金金。 场景 我正在使用Element-plus组件库当中的el-popconfirm和el-tooltip&#xff0c;产品要求是两个需要结合一起使用&#xff0c;也就是鼠标悬浮上去有提示文字&#xff0c;并且点击之后需要出现气泡确认框 代码 <el-popconfirm title"是…

Selenium 查找页面元素的方式

Selenium 查找页面元素的方式 Selenium 提供了多种方法来查找网页中的元素&#xff0c;以下是主要的定位方式&#xff1a; 基本定位方式 通过ID定位 driver.find_element(By.ID, "element_id")通过Name定位 driver.find_element(By.NAME, "element_name"…

OPENCV图形计算面积、弧长API讲解(1)

一.OPENCV图形面积、弧长计算的API介绍 之前我们已经把图形轮廓的检测、画框等功能讲解了一遍。那今天我们主要结合轮廓检测的API去计算图形的面积&#xff0c;这些面积可以是矩形、圆形等等。图形面积计算和弧长计算常用于车辆识别、桥梁识别等重要功能&#xff0c;常用的API…

spring boot使用HttpServletResponse实现sse后端流式输出消息

1.以前只是看过SSE的相关文章&#xff0c;没有具体实践&#xff0c;这次接入AI大模型使用到了流式输出&#xff0c;涉及到给前端流式返回&#xff0c;所以记录一下。 2.resp要设置为text/event-stream resp.setContentType("text/event-stream"); resp.setCharacter…

二叉树-144.二叉树的前序遍历-力扣(LeetCode)

一、题目解析 对于递归方法的前序遍历十分简单&#xff0c;但对于一位合格的程序猿而言&#xff0c;需要掌握将递归转化为非递归的能力&#xff0c;毕竟递归调用的时候会调用大量的栈帧&#xff0c;存在栈溢出风险。 二、算法原理 递归调用本质是系统建立栈帧&#xff0c;而非…

【技巧】dify前端源代码修改第一弹-增加tab页

回到目录 【技巧】dify前端源代码修改第一弹-增加tab页 尝试修改dify的前端源代码&#xff0c;在知识库增加一个tab页"HELLO WORLD"&#xff0c;完成后的效果如下 [gif01] 1. 前端代码进入调试模式 参考 【部署】win10的wsl环境下启动dify的web前端服务 启动调试…

Java设计模式:责任链模式

一、什么是责任链模式&#xff1f; 责任链模式&#xff08;Chain of Responsibility Pattern&#xff09; 是一种 行为型设计模式&#xff0c;它通过将请求沿着一条处理链传递&#xff0c;直到某个对象处理它为止。这种模式的核心思想是 解耦请求的发送者和接收者&#xff0c;…

初探用uniapp写微信小程序遇到的问题及解决(vue3+ts)

零、关于开发思路 (一)拿到工作任务,先理清楚需求 1.逻辑部分 不放过原型里说的每一句话,有疑惑的部分该问产品/测试/之前的开发就问 2.页面部分(含国际化) 整体看过需要开发页面的原型后,分类一下哪些组件/样式可以复用,直接提取出来使用 (时间充分的前提下,不…

云原生时代的系统设计:架构转型的战略支点

&#x1f4dd;个人主页&#x1f339;&#xff1a;一ge科研小菜鸡-CSDN博客 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; 一、云原生的崛起&#xff1a;技术趋势与现实需求的交汇 随着企业业务的互联网化、全球化、智能化持续加深&#xff0c;传统的 I…

python可视化:俄乌战争时间线关键节点与深层原因

俄乌战争时间线可视化分析&#xff1a;关键节点与深层原因 俄乌战争是21世纪欧洲最具影响力的地缘政治冲突之一&#xff0c;自2022年2月爆发以来已持续超过3年。 本文将通过Python可视化工具&#xff0c;系统分析这场战争的时间线、关键节点及其背后的深层原因&#xff0c;全面…

C# WPF 左右布局实现学习笔记(1)

开发流程视频&#xff1a; https://www.youtube.com/watch?vCkHyDYeImjY&ab_channelC%23DesignPro Git源码&#xff1a; GitHub - CSharpDesignPro/Page-Navigation-using-MVVM: WPF - Page Navigation using MVVM 1. 新建工程 新建WPF应用&#xff08;.NET Framework) 2.…

Linux入门(十五)安装java安装tomcat安装dotnet安装mysql

安装java yum install java-17-openjdk-devel查找安装地址 update-alternatives --config java设置环境变量 vi /etc/profile #在文档后面追加 JAVA_HOME"通过查找安装地址命令显示的路径" #注意一定要加$PATH不然路径就只剩下新加的路径了&#xff0c;系统很多命…

【QT控件】显示类控件

目录 一、Label 二、LCD Number 三、ProgressBar 四、Calendar Widget QT专栏&#xff1a;QT_uyeonashi的博客-CSDN博客 一、Label QLabel 可以用来显示文本和图片. 核心属性如下 代码示例: 显示不同格式的文本 1) 在界面上创建三个 QLabel 尺寸放大一些. objectName 分别…

npm安装electron下载太慢,导致报错

npm安装electron下载太慢&#xff0c;导致报错 背景 想学习electron框架做个桌面应用&#xff0c;卡在了安装依赖&#xff08;无语了&#xff09;。。。一开始以为node版本或者npm版本太低问题&#xff0c;调整版本后还是报错。偶尔执行install命令后&#xff0c;可以开始下载…

职坐标物联网全栈开发全流程解析

物联网全栈开发涵盖从物理设备到上层应用的完整技术链路&#xff0c;其核心流程可归纳为四大模块&#xff1a;感知层数据采集、网络层协议交互、平台层资源管理及应用层功能实现。每个模块的技术选型与实现方式直接影响系统性能与扩展性&#xff0c;例如传感器选型需平衡精度与…

【工具教程】多个条形码识别用条码内容对图片重命名,批量PDF条形码识别后用条码内容批量改名,使用教程及注意事项

一、条形码识别改名使用教程 打开软件并选择处理模式&#xff1a;打开软件后&#xff0c;根据要处理的文件类型&#xff0c;选择 “图片识别模式” 或 “PDF 识别模式”。如果是处理包含条形码的 PDF 文件&#xff0c;就选择 “PDF 识别模式”&#xff1b;若是处理图片文件&…

英国云服务器上安装宝塔面板(BT Panel)

在英国云服务器上安装宝塔面板&#xff08;BT Panel&#xff09; 是完全可行的&#xff0c;尤其适合需要远程管理Linux服务器、快速部署网站、数据库、FTP、SSL证书等服务的用户。宝塔面板以其可视化操作界面和强大的功能广受国内用户欢迎&#xff0c;虽然官方主要面向中国大陆…

数据挖掘是什么?数据挖掘技术有哪些?

目录 一、数据挖掘是什么 二、常见的数据挖掘技术 1. 关联规则挖掘 2. 分类算法 3. 聚类分析 4. 回归分析 三、数据挖掘的应用领域 1. 商业领域 2. 医疗领域 3. 金融领域 4. 其他领域 四、数据挖掘面临的挑战和未来趋势 1. 面临的挑战 2. 未来趋势 五、总结 数据…

简约商务通用宣传年终总结12套PPT模版分享

IOS风格企业宣传PPT模版&#xff0c;年终工作总结PPT模版&#xff0c;简约精致扁平化商务通用动画PPT模版&#xff0c;素雅商务PPT模版 简约商务通用宣传年终总结12套PPT模版分享:商务通用年终总结类PPT模版https://pan.quark.cn/s/ece1e252d7df

【Qt】控件 QWidget

控件 QWidget 一. 控件概述二. QWidget 的核心属性可用状态&#xff1a;enabled几何&#xff1a;geometrywindows frame 窗口框架的影响 窗口标题&#xff1a;windowTitle窗口图标&#xff1a;windowIconqrc 机制 窗口不透明度&#xff1a;windowOpacity光标&#xff1a;cursor…