【Day44】

news2025/6/6 17:23:18

DAY 44 预训练模型

知识点回顾:

  1. 预训练的概念
  2. 常见的分类预训练模型
  3. 图像预训练模型的发展史
  4. 预训练的策略
  5. 预训练代码实战:resnet18

作业:

  1. 尝试在cifar10对比如下其他的预训练模型,观察差异,尽可能和他人选择的不同
  2. 尝试通过ctrl进入resnet的内部,观察残差究竟是什么

在统计学和机器学习领域,**残差(Residual)是一个核心概念**,用于衡量模型预测值与实际观测值之间的差异。理解残差有助于评估模型性能、诊断模型问题,并优化模型效果。以下是关于残差的详细解析:


### **一、残差的定义**
- **数学表达式**:  
  对于给定的观测值 \( y_i \) 和模型预测值 \( \hat{y}_i \),残差 \( e_i \) 定义为:  
  \[
  e_i = y_i - \hat{y}_i
  \]  
  例如:若实际房价为100万元,模型预测为95万元,则残差为 \( 100 - 95 = 5 \) 万元。


### **二、残差与误差的区别**
残差常与“误差(Error)”混淆,但两者含义不同:  
| **对比维度**       | **残差(Residual)**                | **误差(Error)**                  |
|--------------------|-------------------------------------|------------------------------------|
| **本质**           | 模型预测值与实际观测值的差异        | 真实值与理论值(不可观测)的差异   |
| **可观测性**       | 可通过数据直接计算得出              | 理论上存在,无法直接观测           |
| **用途**           | 用于模型评估、诊断和优化            | 用于描述模型的理论偏差             |


### **三、残差的作用**
#### 1. **评估模型拟合效果**  
   - **直观判断**:残差绝对值越小,模型预测越准确;反之,模型拟合效果差。  
   - **统计指标**:通过残差的统计量(如均值、方差、均方误差(MSE)、平均绝对误差(MAE))量化模型性能。  
     - 例如:若残差均值接近0,说明模型无系统性偏差;若残差方差大,说明预测值波动大。

#### 2. **诊断模型问题**  
   - **残差分析图**:通过绘制残差图(如残差-预测值图、残差-自变量图),识别模型缺陷:  
     - **非线性关系**:若残差呈现曲线趋势(如U型、倒U型),说明模型可能忽略了非线性关系(需引入多项式特征或换用非线性模型)。  
     - **异方差性**:若残差随预测值增大而扩散(如扇形分布),说明数据存在异方差性(需数据变换或使用加权回归)。  
     - **异常值**:若个别残差绝对值显著偏大,可能对应数据中的异常值,需检查数据或调整模型。

#### 3. **优化模型**  
   - 通过分析残差模式,指导模型改进:  
     - 增加特征(如交互项、多项式项)以捕捉非线性关系;  
     - 更换模型(如从线性回归换为随机森林、神经网络);  
     - 处理异常值或对数据进行标准化/归一化。


### **四、残差的类型(以回归模型为例)**
1. **普通残差(Ordinary Residual)**  
   即最基础的残差 \( e_i = y_i - \hat{y}_i \),适用于初步模型评估。  

2. **标准化残差(Standardized Residual)**  
   - 对残差进行标准化处理,消除量纲影响:  
     \[
     \text{标准化残差} = \frac{e_i}{\hat{\sigma}}
     \]  
     其中 \( \hat{\sigma} \) 为残差的估计标准差,用于比较不同样本的残差大小。  

3. **学生化残差(Studentized Residual)**  
   - 进一步考虑单个样本对模型的影响,剔除当前样本后计算残差,用于检测异常值。


### **五、残差的假设(以线性回归为例)**
在经典线性回归模型中,残差需满足以下假设(**高斯-马尔可夫假设**):  
1. **零均值**:\( E(e_i) = 0 \)(模型无系统性偏差);  
2. **同方差性**:\( \text{Var}(e_i) = \sigma^2 \)(残差方差恒定);  
3. **无自相关性**:\( \text{Cov}(e_i, e_j) = 0 \)(残差之间相互独立);  
4. **正态性**:\( e_i \sim N(0, \sigma^2) \)(残差服从正态分布)。  
若残差不满足这些假设,模型的参数估计和统计检验将失效,需通过数据变换或模型调整解决。


### **六、残差在机器学习中的应用**
在机器学习中,残差的概念同样重要:  
- **集成学习**:如梯度提升树(GBDT)通过拟合残差逐步优化模型,每棵树学习前序模型的残差,最终累加预测值。  
- **模型诊断**:通过交叉验证计算残差,检测模型是否过拟合(如训练集残差低但测试集残差高,可能过拟合)。  


### **总结**
残差是连接模型预测与实际数据的桥梁,其核心价值在于:  
- **量化差异**:衡量模型预测的准确性;  
- **揭示规律**:通过残差模式发现数据中的隐藏信息(如非线性、异常值);  
- **指导优化**:为模型改进提供方向。  
熟练运用残差分析,是提升数据分析和建模能力的关键环节。

浙大疏锦行

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2399553.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于 Alpine 定制单功能用途(kiosk)电脑

前言 故事回到 7 年前, 在网上冲浪的时候发现了一篇介绍使用 Ubuntu 打造 kiosk 单功能用途电脑的文章, 挺好玩的, 就翻译了一下并比葫芦画瓢先后用了 CentOS 7, ArchLinux 进行了实现. 历史文章: 翻译 - 使用Ubutnu14.04和Chrome打造单功能用途电脑(大屏展示电脑) 使用CentOS…

知识图谱系统功能实现,技术解决方案,附源码

基于Java、Neo4j和ElasticSearch构建的医疗知识图谱知识库,是一个融合图数据库技术与搜索引擎的智能化医疗知识管理系统。该系统以Neo4j图数据库为核心,利用其高效的图结构存储能力,将疾病、症状、药品、检查项目、科室等医疗实体抽象为节点&…

洛谷P12610 ——[CCC 2025 Junior] Donut Shop

题目背景 Score: 15. 题目描述 The owner of a donut shop spends the day baking and selling donuts. Given the events that happen over the course of the day, your job is to determine the number of donuts remaining when the shop closes. 输入格式 The first …

1. 数据库基础

1.1 什么是数据库 ⭐ mysql 本质是一种网络服务, 是基于 C(mysql) S(mysqld)的 网络服务. 存储数据用文件就可以了,为什么还要弄个数据库?文件保存数据存在以下缺点: 文件的安全性问题。文件不利于数据查询和管理。文件不利于存储海量数据。…

英伟达288GB HBM4+50P算力

英伟达CEO黄仁勋在COMPUTEX 2025上突然官宣:以暗物质研究先驱Vera Rubin命名的新一代AI芯片即将量产!这颗被称作“算力巨兽”的Rubin GPU,不仅搭载288GB HBM4显存和50 Petaflops推理算力,更携三大颠覆性技术直击AI行业痛点。更可怕…

综合案例:斗地主

综合案例:斗地主 1.程序概述 这是一个模拟斗地主游戏发牌过程的C语言程序,实现了扑克牌的初始化、洗牌和发牌功能。 2.功能需求 2.1 扑克牌定义 使用结构体 Card 表示一张牌,包含: 花色属性suit(0-3表示普通花色♥…

前端组件推荐 Swiper 轮播与 Lightbox 灯箱组件深度解析

在互联网产品不断迭代升级的今天,用户对于页面交互和视觉效果的要求越来越高。想要快速打造出吸睛又实用的项目,合适的组件必不可少。今天就为大家推荐两款超好用的组件 ——Swiper 轮播组件和 Lightbox 灯箱组件,轻松解决你的展示难题&#…

Deepfashion2 数据集使用笔记

目录 数据类别: 筛选类别数据: 验证精度筛选前2个类别: 提取类别数据 可视化类别数据: Deepfashion2 的解压码 旋转数据增强 数据类别: 类别含义: Class idx类别名称英文名称0短上衣short sleeve top1长上衣long sleeve top2短外套short sleeve outwear3长外套lo…

Dify知识库下载小程序

一、Dify配置 1.查看或创建知识库的API 二、下载程序配置 1. 安装依赖resquirements.txt ######requirements.txt##### flask2.3.3 psycopg2-binary2.9.9 requests2.31.0 python-dotenv1.0.0#####安装依赖 pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.…

数据库中求最小函数依赖集-最后附解题过程

今天来攻克数据库设计里一个超重要的知识点 —— 最小函数依赖集。对于刚接触数据库的小白来说,这概念可能有点绕,但别担心,咱们一步步拆解,轻松搞定💪! (最后fuyou) 什么是最小函数…

嵌入式系统中常用的开源协议

目录 1、GNU通用公共许可证(GPL) 2、GNU宽松通用公共许可证(LGPL) 3、MIT许可证 4、Apache许可证2.0 5、BSD许可证 6、如何选择合适的协议 在嵌入式系统开发中,开源软件的使用已成为主流趋势。从物联网设备到汽车…

第二篇:Liunx环境下搭建PaddleOCR识别

第二篇:Liunx环境下搭建Paddleocr识别 一:前言二:安装PaddleOCR三:验证PaddleOCR是否安装成功 一:前言 PaddleOCR作为业界领先的多语言开源OCR工具库,其核心优势在于深度整合了百度自主研发的飞桨PaddlePa…

复杂业务场景下 JSON 规范设计:Map<String,Object>快速开发 与 ResponseEntity精细化控制HTTP 的本质区别与应用场景解析

Moudle 1 Json使用示例 在企业开发中,构造 JSON 格式数据的方式需兼顾 可读性、兼容性、安全性和开发效率,以下是几种常用方式及适用场景: 一、直接使用 Map / 对象转换(简单场景) 通过 键值对集合(如 M…

二叉数-965.单值二叉数-力扣(LeetCode)

一、题目解析 顾名思义,就是二叉树中所存储的值是相同,如果有不同则返回false 二、算法原理 对于二叉树的遍历,递归无疑是最便捷、最简单的方法,本题需要用到递归的思想。 采取前序遍历的方法,即根、左、右。 我们…

[蓝桥杯]对局匹配

对局匹配 题目描述 小明喜欢在一个围棋网站上找别人在线对弈。这个网站上所有注册用户都有一个积分,代表他的围棋水平。 小明发现网站的自动对局系统在匹配对手时,只会将积分差恰好是 K 的两名用户匹配在一起。如果两人分差小于或大于 KK,…

Redis 持久化机制详解:RDB 与 AOF 的原理、优缺点与最佳实践

目录 前言1. Redis 持久化机制概述2. RDB 持久化机制详解2.1 RDB 的工作原理2.2 RDB 的优点2.3 RDB 的缺点 3. AOF 持久化机制详解3.1 AOF 的工作原理3.2 AOF 的优点3.3 AOF 的缺点 4. RDB 与 AOF 的对比分析5. 持久化机制的组合使用与最佳实践6. 结语 前言 Redis 作为一款高性…

【Kotlin】简介变量类接口

【Kotlin】简介&变量&类&接口 【Kotlin】数字&字符串&数组&集合 【Kotlin】高阶函数&Lambda&内联函数 【Kotlin】表达式&关键字 文章目录 Kotlin_简介&变量&类&接口Kotlin的特性Kotlin优势创建Kotlin项目变量变量保存了指向对…

Mybatis入门到精通

一:什么是Mybatis 二:Mybatis就是简化jdbc代码的 三:Mybatis的操作步骤 1:在数据库中创建一个表,并添加数据 我们这里就省略了 2:Mybatis通过maven来导入坐标(jar包) 3&#xff1a…

Unity性能优化笔记

降低Draw Call 降低draw call(unity里叫batches)的方法有: 模型减少材质; 多模型共用材质; 烘焙灯光; 关闭阴影和雾; 遮挡剔除; 使用LOD; 模型减少材质 > 见…

BERT vs Rasa 如何选择 Hugging Face 与 Rasa 的区别 模型和智能体的区别

我在之前的一篇文章中提到我的短期目标的问题,即想通过Hugging Face的BERT或Rasa搭建一个简单的意图识别模型,针对发票业务场景来展示其效果 [如:开发票、查询发票]。 开篇,有必要记录几个英文缩写或术语 (如果喜欢&a…