深度学习界的“任督二脉”:为什么 ResNet 只是简单加了个“x”就封神了?

news2026/4/14 16:45:06
版权声明本文同步发布于个人博客。欢迎交流与转载但请务必注明出处。在深度学习的历史长河中2015年是一个分水岭。这一年何恺明团队提出了残差网络ResNet不仅拿下了ImageNet大赛冠军更彻底改变了我们设计神经网络的方式。很多人看完ResNet的公式后都会一愣“就这不就是把输入x xx直接加到输出上吗Y F ( x ) x Y F(x) xYF(x)x这也太简单了吧”没错它的核心操作确实就是简单的“加法”。但正是这个看似不起眼的“跳跃连接”Skip Connection打通了深层神经网络的“任督二脉”让训练上千层的网络成为可能。今天我们就用大白话聊聊为什么这个简单的“x”如此神奇。一、曾经的困境网络越深反而越笨在ResNet出现之前深度学习界有一个朴素的信念层数越深模型越强。就像读书一样读得越多懂得越多。然而现实给了大家一记响亮的耳光。当研究人员试图把网络堆叠到几十层甚至上百层时发现了一个诡异的现象**网络不仅没有变强效果反而变差了**甚至连在训练集上的准确率都下降了。这就是著名的**“退化问题”Degradation Problem**。这不是过拟合因为训练误差也高了。也不是算不动显卡没爆。而是优化太难了网络找不到正确的参数方向越学越乱。这就好比你给一个团队不断加人本来想提高效率结果人太多反而沟通不畅连原本能做的简单任务都搞砸了。二、ResNet 的天才思路别“从头学”只学“修正量”面对这个困境何恺明团队换了一个角度思考如果我们要构建一个很深的网络理想情况下新增加的层至少不应该让效果变差吧也就是说如果后面的层学不到东西它们应该学会**“什么都不做”数学上叫恒等映射**即H ( x ) x H(x) xH(x)x直接把输入原样传过去就行了。1. 普通网络的难处在普通网络中想要实现“什么都不做”网络必须拼命调整成千上万个权重参数让这一堆复杂的矩阵乘法运算结果恰好等于输入x xx。比喻这就像让你通过调节一堆复杂的水龙头和管道最后流出来的水要和倒进去的水一模一样。这太难了稍微调偏一点结果就错了。2. ResNet 的妙招残差学习ResNet 说既然让网络拟合H ( x ) x H(x) xH(x)x这么难那我们换个目标吧。我们不让网络直接拟合最终结果H ( x ) H(x)H(x)而是让它拟合**“差异”**残差F ( x ) H ( x ) − x F(x) H(x) - xF(x)H(x)−x那么最终的输出就变成了H ( x ) F ( x ) x H(x) F(x) xH(x)F(x)x这有什么好如果理想情况真的是“什么都不做”H ( x ) x H(x)xH(x)x那么网络只需要学习F ( x ) 0 F(x) 0F(x)0。把一堆权重变成 0让神经元“休眠”比让一堆权重配合出完美的恒等变换要容易得多那个“x”的操作就是给了网络一个**“保底机制”**如果你学不到有用的特征那就把F ( x ) F(x)F(x)设为0至少我能把原始信息x xx原封不动地传下去绝不会变差。三、核心魔法那条“跳跃连接”到底干了什么ResNet 的核心结构叫残差块Residual Block里面有一条横跨几层的连线叫跳跃连接Skip Connection。公式很简单输出 卷积层变换 ( 输入 ) 输入 \text{输出} \text{卷积层变换}(输入) \text{输入}输出卷积层变换(输入)输入你觉得这只是个数学加法错在神经网络的**训练过程反向传播**中这个加法引发了物理性质的革命。1. 梯度传播的“高速公路”神经网络的训练靠的是反向传播误差信号需要从最后一层传回第一层告诉前面的层该怎么改参数。没有跳跃连接时误差信号必须穿过每一层的激活函数和权重。数学上是连乘关系梯度 ⋯ × w 3 × w 2 × w 1 \text{梯度} \dots \times w_3 \times w_2 \times w_1梯度⋯×w3​×w2​×w1​。后果如果权重w ww小于1连乘几十次后梯度就变成了0梯度消失。前面的层收不到任何指令根本没法更新网络“死”掉了。有了跳跃连接后因为公式里有 x xx当我们求导时多出了一项∂ ( 输出 ) ∂ x ∂ F ( x ) ∂ x 1 \frac{\partial (\text{输出})}{\partial x} \frac{\partial F(x)}{\partial x} \mathbf{1}∂x∂(输出)​∂x∂F(x)​1注意那个1 \mathbf{1}1这意味着无论中间的卷积层F ( x ) F(x)F(x)变得多么复杂、权重变得多么小永远有一个大小为 1 的梯度可以通过那条跳跃连线无损地、直接地传回前面比喻普通网络像玩“传声筒”游戏话经过几十个人传递最后面目全非梯度消失。ResNet旁边拉了一根专用电话线。不管传声筒那边多吵电话线里永远能清晰地听到原始声音。这保证了深层网络的“大脑”能收到清晰的指令。2. 集成学习的视角从另一个角度看跳跃连接让数据有了多条路径有的数据走了全部 50 层。有的数据通过跳跃连接只走了 48 层、40 层甚至 2 层就直接到了后面。这使得 ResNet 不像是一个单一的“深”网络而更像是一个由很多不同深度的子网络组成的“超级团队”。这种结构本身就比单一的深层网络更鲁棒更不容易出错。四、结局深度不再是瓶颈有了 ResNet 之后发生了什么以前大家不敢超过 20 层。有了 ResNet50 层、101 层、152 层随便堆而且层数越深效果真的越好再也没有出现“越深越笨”的情况。ResNet 的出现让计算机视觉模型的性能突飞猛进并迅速成为了所有深度学习任务的标准骨干网络Backbone。直到今天无论是识别图片、检测物体还是大模型的视觉编码器你依然能看到 ResNet 的影子。五、总结ResNet 的伟大不在于它用了多么复杂的数学技巧而在于它洞察了优化的本质思维转变从“学习完整函数”转变为“学习微小修正残差”。结构创新通过跳跃连接x创造了一条梯度为 1 的无损通道彻底解决了梯度消失问题。保底机制让“躺平”输出0成为合法的最优解确保了增加层数永远不会让模型变差。所以下次当你看到Y F ( x ) x Y F(x) xYF(x)x这个简单的公式时请不要忽视它。这条简单的“加法”连线正是打通深度学习任督二脉的关键钥匙。一句话总结ResNet 告诉我们有时候“保留初心”加上原始的 x比“盲目重塑”更能走向成功。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2517037.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…