非人工智能方向粗糙理解深度学习

news2025/7/11 13:31:56

非人工智能方向粗糙理解深度学习

  • 线性模型基本形式
  • 线性回归
    • 数据集
    • 学习目标
    • 均方误差
  • 监督学习
  • 弱监督学习
    • 不完全监督
      • 主动学习
      • 半监督学习
      • 迁移学习
    • 不确切监督
    • 不准确监督

线性模型基本形式

你要训练的线性模型(模型不一定是线性的,为方便理解,此处以线性举例):
f ( x ) = w 1 x 1 + w 2 x 2 + w 3 x 3 + ⋯ + w d x d + b f(\bm{x}) = w_1x_1 + w_2x_2 + w_3x_3 + \cdots + w_dx_d + b f(x)=w1x1+w2x2+w3x3++wdxd+b f ( x ) = w ⊤ x + b f(\bm{x}) = \bm{w}^\top\bm{x} + b f(x)=wx+b 其中 x = ( x 1 , x 2 , x 3 , ⋯   , x d ) \bm{x} = (x_1, x_2, x_3, \cdots, x_d) x=(x1,x2,x3,,xd) 是你要输入的数据,组成了输入 d d d 维特征向量 x \bm{x} x(这个特征向量各种各样,可以来自数据集的人类可以理解的具象数据,也可以用 CNN 卷出来的人类理解不了的抽象数据); w , b \bm{w}, b w,b 作为模型权重参数(并非网络参数,网络是求模型的,模型本身有自己的参数,网络本身也有自己的参数如深度、维度); f ( x ) f(\bm{x}) f(x) 作为输出,如分类结果、回归预测。

  • 例子一,猫狗分类:

    • 特征空间内输入 x 1 x_1 x1 表示耳朵长度, x 2 x_2 x2 表示鼻头子长度, x 3 x_3 x3 表示胡子长度等;
    • w 1 , w 2 , w 3 , ⋯   , b w_1, w_2, w_3, \cdots, b w1,w2,w3,,b网络要训练得到的这个线性模型的参数,目前未知
    • f ( x ) ∈ [ 0 , 1 ] f(\bm{x}) \in [0, 1] f(x)[0,1],做为最终输出,越接近 0 0 0 越像猫,越接近 1 1 1 越像狗。
  • 例子二,房价回归预测:

    • 特征空间内输入 x 1 x_1 x1 地段(抽象,但你可以编码为浮点数), x 2 x_2 x2 表示房屋面积, x 3 x_3 x3 表示套型(抽象,但你可以编码为浮点数);
    • w 1 , w 2 , w 3 , ⋯   , b w_1, w_2, w_3, \cdots, b w1,w2,w3,,b网络要训练得到的这个线性模型的参数,目前未知
    • f ( x ) ∈ [ 0 , 1 ] f(\bm{x}) \in [0, 1] f(x)[0,1],做为最终输出,越接近 0 0 0 越像猫,越接近 1 1 1 越像狗。
  • 例子三, 0 − 9 0-9 09 手写体识别:

    • 输入灰度图像,经过 CNN 卷出来特征空间内的特征值 x = ( x 1 , x 2 , x 3 , ⋯   , x d ) \bm{x} = (x_1, x_2, x_3, \cdots, x_d) x=(x1,x2,x3,,xd),输入后面的线性模型(不一定是线性,但总有一个函数,能将各个 0 − 9 0-9 09 手写体的特征映射到 0 − 9 0-9 09 的标准答案上,此处仅为理解方便);
    • w 1 , w 2 , w 3 , ⋯   , b w_1, w_2, w_3, \cdots, b w1,w2,w3,,b网络要训练得到的这个线性模型的参数,目前未知
    • f ( x ) ∈ N , f ( x ) ≤ 9 f(\bm{x}) \in \mathbb{N}, f(\bm{x}) \leq 9 f(x)N,f(x)9,做为最终输出。

以 CNN 为例:左侧为原始手写体灰度图像(人类看得懂,网络看不懂),右侧为经过卷积后的特征图像(人类看不懂,网络目前也看不懂,但是处理起来更方便了;当然后续可能要经过多层卷积并池化后,才可将浓缩后的数据送入网络训练)。在这里插入图片描述
以下为 4*4 单元内最大池化示例,进一步将数据量浓缩。在这里插入图片描述
在这里插入图片描述
浓缩后的数据可送入全连接层进行线性回归(打个比方)。
在这里插入图片描述

线性回归

本节会解答 w 1 , w 2 , w 3 , ⋯   , b w_1, w_2, w_3, \cdots, b w1,w2,w3,,b 作为线性模型的未知参数,如何训练,训练目标是什么的问题。

数据集

也可以叫做样本,如 m m m 个样本: D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , ⋯   , ( x m , y m ) } D = \{ (\bm{x_1}, y_1), (\bm{x_2}, y_2), \cdots, (\bm{x_m}, y_m) \} D={(x1,y1),(x2,y2),,(xm,ym)};其中每个样本输入存在 d d d 维特征: x i = ( x i 1 , x i 2 , ⋯   , x i d ) \bm{x_i} = (x_{i1}, x_{i2}, \cdots, x_{id}) xi=(xi1,xi2,,xid);每个样本对应一个标准答案输出 y i y_i yi(当然非线性模型或其他模型下你可能会得到一个多维向量输出 y i \bm{y_i} yi)。

学习目标

毋庸置疑,如果一个模型训练的好,学习后应该有回答等于标准答案,也就是 f ( x i ) = y i f(\bm{x_i}) = y_i f(xi)=yi,或误差损失 ( f ( x i ) − y i ) 2 = 0 (f(\bm{x_i}) - y_i)^2 = 0 (f(xi)yi)2=0。换言之,线性回归试图习得: f ( x i ) = w i x i + b , f ( x i ) ≃ y i f(\bm{x_i}) = \bm{w_i}\bm{x_i} + b, f(\bm{x_i}) \simeq y_i f(xi)=wixi+b,f(xi)yi

均方误差

为了衡量网络回答 f ( x i ) f(\bm{x_i}) f(xi)标准答案 y i y_i yi 之间的差别,以确定 w , b \bm{w}, b w,b w ∗ , b ∗ \bm{w^*}, b^* w,b,我们可以引入均方误差:
( w ∗ , b ∗ ) = arg min ⁡ ( w , b ) ∑ i = 1 m ( f ( x i ) − y i ) 2 = arg min ⁡ ( w , b ) ∑ i = 1 m ( y i − w ⊤ x i − b ) 2 (\bm{w^*}, b^*) = \argmin_{(\bm{w}, b)} \sum_{i=1}^{m}{(f(\bm{x_i}) - y_i)^2} = \argmin_{(\bm{w}, b)} \sum_{i=1}^{m}{(y_i - \bm{w^\top x_i } - b)^2} (w,b)=(w,b)argmini=1m(f(xi)yi)2=(w,b)argmini=1m(yiwxib)2
这本质上是一个优化问题,类似凸优化中求何处 ( w , b ) (\bm{w}, b) (w,b) 取值,使得整体 l o s s loss loss 最小。 BP 中可对未知参数求偏导采用梯度下降法反向传播,迭代更新每个神经元参数,以求出最优的 ( w ∗ , b ∗ ) (\bm{w^*}, b^*) (w,b)。现实优化问题可采用模拟退火、随机梯度下降、遗传算法等完成此过程。

注意,这里 x \bm{x} x 作为数据集输入为已知 y i y_i yi 作为数据集标准输出也为已知,你要求的反而是模型的未知组参数 ( w , b ) (\bm{w}, b) (w,b) ( w ∗ , b ∗ ) (\bm{w^*}, b^*) (w,b)

监督学习

数据集 D D D 可以划分为两块 D = D 1 ∪ D 2 D = D_1\cup D_2 D=D1D2。一块 D 1 D_1 D1 用于训练 ( w ∗ , b ∗ ) (\bm{w^*}, b^*) (w,b),称为监督集;一块 D 2 D_2 D2 用于测试你获得的模型 f ( x ) = w ∗ ⊤ x + b f(\bm{x}) = \bm{w^*}^\top\bm{x} + b f(x)=wx+b,验证合理性或享受成就感,称为测试集

弱监督学习

可分为不完全监督、不确切监督、不准确监督。与传统的监督学习相比,其使用有限的、含有噪声的或者标注不准确的数据来进行模型参数的训练,如:

  • 数据集 D D D 内样本数 m m m 较小;
  • x i \bm{x_i} xi 内部分维度值缺失,或部分 y i y_i yi 缺失;
  • D D D 内存在垃圾噪声(错误标准答案、无效输入等),需清洗。

不完全监督

数据集 D D D 残缺只有部分带有标签,假若为获得强监督信号,将全部缺失标签咨询专家添加标签,消耗成本太大。

主动学习

在查询次数尽可能小的情况下,选择出最有价值的未标注数据来查询人类专家,使得训练出的模型性能最好。旨在提高查询效率。

半监督学习

没有人类专家参与,根据数据分布特征,做聚类假设或流形假设,使得相近样本返回相似预测结果。

迁移学习

利用源领域 D s D_s Ds源任务 T s T_s Ts 中的知识,解决目标领域 D t D_t Dt目标任务 T t T_t Tt 中的预测函数 f t ( x ) f_t(\bm{x}) ft(x),或提升 f t ( x ) f_t(\bm{x}) ft(x) 的预测效果。

不确切监督

数据集中每个实体内没有标注明确的监督信息,输入特征维度不明确。如肺炎患者胸片,并不确切何处病灶会导致患病。

不准确监督

大数据集内出现的标注错误,可视为噪声。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/29074.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ceph部署踩坑——OSD服务无法启动

前话:部署ceph时,所有OSD节点的服务启动报错,无法正常启动服务。 问题现象:OSD节点启动ceph-osd0.service服务报错,start request repeated too quickly for ceph-osd0.service 解决过程: 1、修改启动的…

线上演唱会成歌手身价新标准,十月天传媒正式合作腾格尔

曾记得某位音乐人说过,每一位歌手都有自己的段位,其实也就是所谓的身价和演出费用。歌手的身价段位,要通过演唱会的出场费来体现,可惜最近两年由于特殊原因,线下演唱会已经很难举办。 既然线下演唱会很难举办&#xff…

Nginx:过滤模块的实现

文章目录1、过滤模块的概念2、过滤模块原理2.1、过滤链表2.2、执行顺序3、过滤模块的实现3.1、编写模块结构3.1.1、模块配置结构3.1.2、模块配置命令3.1.3、模块上下文3.1.4、定义模块3.2、设置响应头3.3、设置响应体3.4、编译测试3.5、完整代码4、参考文章参考<零声教育>…

牛客网语法篇练习分支控制(二)

1.牛牛的通勤路上有两种选择&#xff0c;要么走路&#xff0c;要么打车&#xff0c;牛牛走路的速度是 1m/s 。打车的速度的 10m/s &#xff0c;但是打车需要等出租车 10 s&#xff0c;请你计算牛牛想尽快到公司应该选择打车还是走路。 a int(input()) if a < a / 10 10:p…

单商户商城系统功能拆解35—分销应用—分销概览

单商户商城系统&#xff0c;也称为B2C自营电商模式单店商城系统。可以快速帮助个人、机构和企业搭建自己的私域交易线上商城。 单商户商城系统完美契合私域流量变现闭环交易使用。通常拥有丰富的营销玩法&#xff0c;例如拼团&#xff0c;秒杀&#xff0c;砍价&#xff0c;包邮…

热烈祝贺|盏百年生物科技有限公司受邀参加2022世界滋补产业生态大会

自2017年“盏百年”品牌创立以来&#xff0c;公司致力于以鲜炖燕窝为导向&#xff0c;以燕窝全产业链建设为核心&#xff0c;打造中国燕窝文化专营品牌。 5年来&#xff0c;盏百年凭借实体体验服务店连锁经营&#xff0c;打造一对一私人滋补管家这一创新模式&#xff0c;树立了…

什么是分布式锁?他解决了什么样的问题?

相信对于朋友们来说&#xff0c;锁这个东西已经非常熟悉了&#xff0c;在说分布式锁之前&#xff0c;我们来聊聊单体应用时候的本地锁&#xff0c;这个锁很多小伙伴都会用 ✔本地锁 我们在开发单体应用的时候&#xff0c;为了保证多个线程并发访问公共资源的时候&#xff0c;…

Apache DolphinScheduler新一代分布式工作流任务调度平台实战

总体架构 MasterServer&#xff1a;MasterServer采用分布式无中心设计理念&#xff0c;MasterServer主要负责 DAG 任务切分、任务提交监控&#xff0c;并同时监听其它MasterServer和WorkerServer的健康状态。 MasterServer服务启动时向Zookeeper注册临时节点&#xff0c;通过监…

Java集合框架【二容器[LinkedList容器类、Set接口]】

文章目录一 LinkedList容器类1.1 LinkedList的使用(List接口)1.2 Linked的使用(非List标准)1.4 LinkedList源码分析二 Set接口2.1 Set接口特点2.2 HashSet容器类2.2.1 Hash算法原理2.2.2 HashSet的例子2.2.3 HashSet存储特征分析2.3 TreeSet容器类2.4 通过元素自身实现比较规则…

[附源码]java毕业设计学校失物招领系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

【尚硅谷】IDEA2022快速上手开发利器

【尚硅谷】IDEA2022快速上手开发利器 【尚硅谷】IDEA2022快速上手开发利器一、详细设置1.1 如何打开详细配置界面1.2 系统设置1.3 设置整体主题1.4 设置编辑器主题样式1.5 显示行号与方法分隔符1.6 代码智能提示功能1.7 自动导包配置1.8 设置项目文件编码&#xff08;一定要改&…

uniapp小程序实现圆环效果

文章目录调用组件uniapp小程序利用 canvas2d实现根据指定时间动态画圆环效果调用 <view class"dubbing-control" :style"{width:recordWidth,height:recordWidth}"><dubbing-button v-if"show" :width.sync"recordWidth" :s…

e智团队实验室项目-第四周-YOLOv论文的对比实验中遇到的问题

贾小云*&#xff0c;赵雅玲 *, 张钊* , 李锦玉*&#xff0c;迟梦瑶*&#xff0c;赵尉*&#xff0c;潘玉*&#xff0c;刘立赛&#xff0c;祝大双&#xff0c;李月&#xff0c;曹海艳&#xff0c; (淮北师范大学计算机科学与技术学院&#xff0c;淮北师范大学经济与管理学院&…

2022年度国家级科技企业孵化器开始申报

科技部火炬中心关于开展2022年度国家级科技企业孵化器申报工作的通知各省、自治区、直辖市及计划单列市科技厅&#xff08;委、局&#xff09;&#xff0c;新疆生产建设兵团科技局&#xff1a; 为贯彻落实党的二十大精神&#xff0c;加快实施创新驱动发展战略&#xff0c;加快实…

MySQL操作

目录 1.对库操作 1.1 创建数据库 1.1.1 查看有哪些数据库 1.1.2 指定数据库的字符集 1.1.3 查重创建数据库 1.1.4 查看警告信息 1.1.5 小知识:SQL语句中的分号 1.1.6 小知识:设置默认字符集 1.1.7 小知识:语句中的大小写 1.2 使用/选中数据库 1.3 删除数据库(慎重操作…

PHP视频网站用wamp、phpstudy运行定制开发mysql数据库BS模式

一、源码特点 PHP视频网站是一套完善的web设计系统&#xff0c;对理解php编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库系统主要采用B/S模式开发,开发环境为PHP APACHE&#xff0c;数据库为mysql5.0&#xff0c;使 用php语言开发 PHP视频网站用wamp、phpstu…

21. [Python GUI] PyQt5中的模型与视图框架-抽象模型基类QAbstractItemModel与自定义模型

PyQt5中的抽象模型基类QAbstractItemModel与自定义模型 一、关于QAbstractItemModel类 QAbstractItemModel类继承自QObject&#xff0c; 该类是Qt所有模型类的基类&#xff0c;用于管理模型/视图结构中的数据。Qt的所有模型都需要子类化该类。注意&#xff0c;该类是抽象类&am…

数字孪生应用方向展示

昨晚&#xff0c;2022年卡塔尔世界杯正式打响&#xff01;伴随开幕式的进行&#xff0c;由中国铁建城建的卡塔尔世界杯主场馆卢赛尔体育场惊艳全球。事实上&#xff0c;在数字孪生技术的加持下&#xff0c;体育场馆建设也是重点技术应用方向之一&#xff0c;今天就为大家重点展…

java读取文件

先看项目截图 public class FileTest {public static void main(String[]args) throws IOException {String path Objects.requireNonNull(FileTest.class.getClassLoader().getResource("")).getPath();System.out.println(path);System.out.println("****…

微信“史诗级”更新,小而美终于回来啦~

最近微信安卓版又有了更新&#xff0c;版本号也来到了8.0.30。 此次更新又被业界称之为“史诗级”更新&#xff0c;主要原因是新版本微信安装包体积缩小了10M。 没错&#xff0c;你没有看错微信的安装包真的缩小了&#xff0c;而且整整缩小了10M&#xff01; 天呐&#xff0…