模式识别与机器学习(更新中)

news2025/7/18 9:28:35

模式识别与机器学习

使用的教材,PPT为1

公式推导部分直接去看白板推导2,不管是书上还是ppt都写的极其模糊

先说重点:

  • 贝叶斯算概率
  • 参数估计

第二讲 贝叶斯学习基础

image-20221113232632080

贝叶斯公式

先验概率是非条件概率

似然概率是给定变量的条件下观测变量的概率

后验概率是给定数据的条件下观测变量的概率

image-20221110174051218

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CxnCiJvk-1668446316791)(PRML.assets/image-20221113232749527.png)]

贝叶斯决策

最小错误率贝叶斯决策

决策的平均错误率尽可能地小。

二分类

image-20221110210242357

也就是说后验概率大的就是所求的。

多分类

对于更一般化的多类分类问题,最小错误率决策表示为最大化平均正确率

可能错分的情况存在种,涉及到的计算很多,所以通常采样计算平均正确率来计算

image-20221110210717712

  • 所有的类别分母都是相同的,所以决策时实际上只需比较分子即可。

最小风险贝叶斯决策

最小化决策带来的平均损失,也叫做最小化风险(risk)

image-20221112163309189

平均损失的两重含义

  • 获得观测值后,决策造成的损失对实际所属类别的各类可能的平均,称为条件风险(conditional risk)
  • 条件风险对x的数学期望,称为总体风险
  • image-20221112164258889

最小错误率是最小风险的一种特殊情况

关于两种方式的区别去看书上p38 题二

分类器

分类器是一个计算系统,它通过计算出一系列判别函数的值做出分类决策,实现对输入数据进行分类的目的。分类器的构建离不开判别函数决策面

判别函数是一个从输入特征映射到决策的函数,其结果可以直接用于做出分类决策。

分类问题中,分类器会把输入空间划分成多个决策区域,这些决策区域之间的边界称作决策面决策边界

分类器的构建方法

image-20221114004841976

image-20221110213029821

基于高斯分布的贝叶斯分类器

image-20221112165529012

协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

image-20221113020626726

协方差矩阵可以参考这篇[3]:https://eipi10.cn/mathematics/2021/05/12/covariance_matrix/

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sERa3vM4-1668446316855)(PRML.assets/image-20221113023211023.png)]

不同维度下的判别面:

image-20221110213900176

朴素贝叶斯分类器

朴素贝叶斯(naïve Bayes)分类器对条件概率分布提出了特征条件独立的假设,所谓的朴素就是特征条件独立

朴素贝叶斯假设向量的D个元素之间相互独立,其联合分布可以写成 D个独立的概率分布相乘

image-20221112135203833

参数估计

最大似然估计

最大似然估计是一种给定观测时估计模型参数的方法,它试图在给定观测的条件下,找到最大化似然函数的参数值。

image-20221112162239063

最大后验估计

最大后验估计是在最大似然估计的基础上考虑参数的先验分布,通过贝叶斯公式获得参数的后验分布 ,并以后验分布作为估计的优化目标。

期望最大化算法(expectation maximization,EM)

:对不完整数据建模时,使用隐变量定义缺失数据

对复杂的观测数据建模时,使用隐变量定义潜在因素。

考虑一个概率模型,X表示观测变量集,Z表示隐变量集,θ表示模型参数,目标是最大化观测变量X对参数θ的对数似然函数

image-20221112212305830

EM算法是一种迭代算法,常用于求解带有隐变量的概率模型的最大似然或者最大后验估计。

E步:根据给定观测变量X和当前参数θ推理隐变量Z的后验概率分布,并计算观测数据X和隐变量Z的对数联合概率关于Z的后验概率分布的期望;

M步:最大化E步求得的期望,获得新的参数θ。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YMlh4rx1-1668446316871)(PRML.assets/image-20221114021406358.png)]

第三讲 逻辑回归

image-20221112231800413

线性回归

image-20221112234440783

基函数(basis function):对输入特征的变换函数

image-20221113003252464

  • 多项式基函数的一个局限性是它们是输入变量的全局函数,所以一个区域内个改变会影响所有区域。

  • μ j μ_j μj控制着基函数在输入空间中的位置,参数 s s s控制着基函数的空间大小

  • 可以对自变量进行非线性变换,在得到新的自变量后进行线性回归建模。

使用高斯随机噪声实现概率建模

概率线性回归的一种方式是高斯随机误差概率建模,观测的输出被假设为确定性的线性回归加上一个高斯随机噪声

image-20221113003445224

最小二乘与最大似然

最小二乘问题的目标为调整模型函数的参数来最好地拟合数据集。模型对数据的拟合程度是通过其误差来测量的。

最大似然是因为减去的是似然,要越大越好

image-20221113003801192

二乘的意思就是误差乘两次

最小值可通过将对优化目标关于参数的导数设为0求解得到。

模型有D个参数,就有D个梯度方程

P9

image-20221114001040560

P10

image-20221114001129822

正则化最小二乘与最大后验

使用L_2范数作为惩罚项的正则化最小二乘也叫做岭回归。

P11

image-20221114001310286

逻辑回归

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-L9KZXAAP-1668446316931)(PRML.assets/image-20221113203119577.png)]

第四讲 概率图模型基础

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7Ml63rkq-1668446316935)(PRML.assets/image-20221113203908290.png)]

有向图

概率图的构建可以由拓扑排序

一个贝叶斯网络由两部分组成:

①有向无环图G=(V,E) ,其中V表示有向图中节点的集合,E表示图中有向边的集合。

②父节点到子节点的条件概率分布。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tDQNhkNi-1668446316936)(PRML.assets/image-20221113233956430.png)]

局部马尔可夫性:贝叶斯网络中每一个节点在给定其父节点的条件下与其他非后代节点条件独立。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D80Zatc0-1668446316937)(PRML.assets/image-20221113210901950.png)]

image-20221114001431136

顺序结构(head to tail)

节点𝑐连接了一个箭头的头部和另一个箭头的尾部。

顺序结构具有条件独立性:在给定𝑐的条件下,𝑎和𝑏条件独立。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GVZeFDRb-1668446316941)(PRML.assets/image-20221113210623985.png)]

发散结构(tail to tail)

节点c连接两个箭头的尾部。

发散结构具有条件独立性:在给定c的条件下,a和b条件独立。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-00Czfcsc-1668446316946)(PRML.assets/image-20221113210659293.png)]

汇总结构(head to head)

节点c连接了两个箭头的头部。

汇总结构不具有条件独立性:在给定c的条 件下,a和b条件不独立。 只有这个是特殊的

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bL9KrE0c-1668446316948)(PRML.assets/image-20221113210725335.png)]

d-分隔规则

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iplApFUj-1668446316952)(PRML.assets/image-20221113214115288.png)]马尔可夫毯(Markov blanket)

参考[4] https://blog.csdn.net/jbb0523/article/details/78424522

说人话就是最后留下的是该点的父亲,儿子,儿子的其他父亲

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ut7pI8Xj-1668446316953)(PRML.assets/image-20221113223447926.png)]

image-20221114001612851

常见的有向图模型

朴素贝叶斯和隐马尔可夫模型

image-20221113234720705

朴素贝叶斯网络

**隐马尔可夫模型(**hidden Markov model)

image-20221114001913702

无向图模型

任一变量x_k在给定它的邻居的情况下条件独立于所有其他变量,表示为x_k在给定邻居变量和给定其他所有变量条件下的概率分布相同

条件独立性体现在:全局,局部,成对

无向图中的一个全连通子图,称为团(clique),即团内的所有节点之间都有边相连。

在所有团中,如果一个团不能被其它的团包含,这个团就称作一个最大团(maximal clique)。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-X7As3uw6-1668446316961)(PRML.assets/image-20221114124203857.png)]

图模型中的推理

因子图3

将一个具有多变量的全局函数因子分解,得到几个局部函数的乘积,以此为基础得到的一个双向图叫做因子图(Factor Graph)。

因子图在变量节点(下图中圆形表示)外,额外引入了因子节点(下图中方形表示)

因子图与图模型的对应关系:

  • 因子图中的变量节点与对应图模型中的变量节点相同;

  • 因子图中对应图模型中同一因子的变量节点之间存在一个因子节点;

  • 因子图中的边都是无向边,连接因子节点与相对应的变量节点。

因子图主要有两个用途,1)表达因子分解的结构,2)计算边缘函数。

因子分解4

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YUBlLsuD-1668446316964)(PRML.assets/image-20221114152422112.png)]

p ( X ) p(X) p(X)分解为几个局部函数的乘积,每个函数的参数均为 X 的子集

边缘函数

$X−xi $为 X X X 中除$ xi 之 外 的 其 他 元 素 组 成 的 集 合 , 则 称 之外的其他元素组成的集合,则称 pi(xi) 为 为 p(x1,x2,…,xn)$ 的一个边缘函数 。

边缘函数的解就是边缘概率(先验概率):某个事件发生的概率

边缘概率是通过边缘化(marginalization)得到的:在联合概率中,把最终结果中不需要的那些事件合并成其事件的全概率而消失(对离散随机变量用求和得全概率,对连续随机变量用积分得全概率)

和积算法

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-keFzSZP2-1668446316967)(PRML.assets/image-20221114160817793.png)]

和:求解的因子结节和它相连的变量节点的和

积:求解的因子节点和其他因子节点的积

和积算法的步骤如下:

① 选择任何一个变量节点或因子节点作为根节点

② 由叶子节点向根节点执行一次消息传递;

③ 由根节点向叶子节点执行一次消息传递;

④ 根据边缘分布的计算公式得出任意变量节点的边缘分布。

参考3给出了直观的例子

支持向量机

image-20221114233349815

支持向量机由简至繁有5:

  • 线性可分SVM
    • 通过硬间隔最大化可以学习得到一个线性分类器,
  • 线性SVM
    • 当训练数据不能线性可分但是可以近似线性可分时,通过软间隔(soft margin)最大化也可以学习到一个线性分类器
    • 软间隔:有一定的容错率,引入了松弛变量
  • 非线性SVM
    • 当训练数据线性不可分时,通过使用核技巧(kernel trick)和软间隔最大化,可以学习到一个非线性SVM。

image-20221114232527505

对于p维向量,用 p − 1 p-1 p1维的超平面隔开所有点,SVM选择能够使每一类离超平面最近的数据点的距离最大的超平面。

样本中距离超平面最近的一些点,这些点叫做支持向量

image-20221114233150291

基本分类模型

间隔最大化问题的数学表达就是image-20221115001850205

具体的推导过程可以参考6

image-20221115001646812

拉格朗日对偶优化

线性不可分数据的分类

引入了软间隔

往年题

往年汇总

2021 : https://blog.csdn.net/qq_40394960/article/details/112580581?spm=1001.2014.3001.5502

考点频率

EM算法

马尔科夫毯

2014

和积算法的过程是什么?

  • 因子图,和积算法

马尔科夫毯的主要变量有哪些。

在可信贝叶斯网络中,一个节点的马尔可夫毯为该节点的父节点、子节点以及子节点的父节点。

参考资料


  1. 《模式识别与机器学习》 ↩︎

  2. https://www.bilibili.com/video/BV1aE411o7qd?p=3&vd_source=b3aaf2cdc79875f83fdd149e1178ce26 ↩︎

  3. 因子图介绍 ↩︎ ↩︎

  4. https://zhuanlan.zhihu.com/p/84210564 ↩︎

  5. 支持向量机(Support Vector Machine, SVM) ↩︎

  6. https://zhuanlan.zhihu.com/p/77750026 ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/9007.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

贤鱼的刷题日常--P1665 正方形计数--题目详解

🏆今日学习目标: 🍀学习了解–P1665 正方形计数 ✅创作者:贤鱼 ⏰预计时间:5分钟 🎉个人主页:贤鱼的个人主页 🔥专栏系列:c 🍁贤鱼的个人社区,欢迎…

基于matlab的瑞利衰落信道建模和仿真

目录 1.算法概述 2.仿真效果预览 3.核心MATLAB预览 4.完整MATLAB程序 1.算法概述 无线信道的小尺度衰弱特征可以分为三大类: 一类是由于多径传播导致短时间内幅度衰落; 一类是由于多径的时延扩展引起时间色散导致的信道衰弱; 一类是由于…

点成分享 | 微流控技术集成系统的应用

一、背景 微流控技术是指把化学和生物等领域中涉及的样品制备、反应、分离、检测、细胞培养、分选、裂解等基本操作单元集成到一块几平方厘米甚至更小的芯片上,由微通道形成网络,以可控流体贯穿整个系统,用以实现常规化学、生物、材料、光学…

SAP UI5 SmartTable 控件的使用介绍试读版

本文来自笔者 SAP 开发技术交流知识星球内一位朋友的提问: smartfilter bar 有个输入框Cost Element绑定了cds实现value help 请问其对应的suggestion功能是通过cds的注解实现的嘛? 要回答这个问题,我们必须首先掌握 SAP UI5 SmartTable 控件…

软考应该如何备考?

首先应该选择软考的科目,软考科目众多,计算机软件资格考试设置了27个专业资格,涵盖5个专业领域, 3个级别层次(初级、中级、高级)。 首先软考报名是不限学历,经验,资历的,…

cpu设计和实现(iverilog工具)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 编写verilog的工具不少。大家熟知的modelsim、quartus和vivado都可以用来编写的。前者主要是用来仿真,quartus主要用于altera芯片&…

伪元素和伪类的概念和区别

目录 伪类 伪元素 区别: 对于区别的解释: 伪类 这是菜鸟教程下方的一个笔记,看着多但是干货满满。 伪类选择元素基于的是当前元素处于的状态,或者说元素当前所具有的特性,而不是元素的id、class、属性等静态的标志。…

小程序获取不到用户头像和昵称返回微信用户问题解决,即小程序授权获取用户头像规则调整的最新解决方案

最近好多同学在学习石头哥小程序课程的时候,遇到了下面这样的问题,在小程序授权获取用户头像和昵称时,获取到的是下面这样的。 到底是什么原因导致的呢,去小程序官方文档一看,又是官方改规则了。 点进去一看&#x…

超详细!linux系统nlg-eval安装指南

前言:最近在做文本生成的任务,需要用到bleu等评价指标,看到其他研究工作中都在用nlg-eval这个github库,就想把它拿过来用,然而安装过程并不是一帆风顺的,谨以此篇博客记录之,为后来者提供一些经…

【菜菜的sklearn课堂笔记】逻辑回归与评分卡-重要参数penalty C

视频作者:菜菜TsaiTsai 链接:【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili 正则化是用来防止模型过拟合的过程,常用的有L1正则化和L2正则化两种选项。这个增加的范式,被称为“正则项”,也…

11个开源测试自动化框架,如何选?

以下为作者观点: 如果你正在考虑建立你自己的测试自动化框架,请再想一想。在大多数情况下,你最好可以考虑一个或多个可用的开源选项。 这是因为,一般来说,框架是一套可以跨团队使用的最佳实践、假设、通用工具和库。…

操作符详解(C语言)

算术操作符(运算符): - * / % 在算术运算符中, - * 跟我们数学中的运算是一样的 在这里主要说一下 / 跟 % 这两个操作符 1、/ (除法) 在除法运算中,若除号两边的操作数都为整型,则结果…

布隆过滤器(Bloom Filter)

[TOC](布隆过滤器(Bloom Filter)) (1)什么是布隆过滤器 (1)布隆过滤器的简单介绍 布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以…

Python中的print()

本专栏为学习B站杨淑娟老师视频所记,仅做个人笔记使用😋😋😋 👉杨淑娟老师视频课👈 Python 职位方向 一、chapter1 1.使用print函数进行简单的输出 a100 # 变量a,值为100 b50 # 变量b,值为50print(90) …

【Linux实验】软中断通信

实验目的: 1.了解什么是信号,熟练掌握signal(),wait(),exit(),kill()函数。 2.熟悉并掌握Linux系统…

Learning to Enhance Low-Light Image via Zero-Reference Deep Curve Estimation

学习目标: Learning to Enhance Low-Light Image via Zero-Reference Deep Curve Estimation(零参考深度曲线估计) 个人体会: 本文的特色就是使用了PA和CA,对不同通道和不同像素做不同处理,虽然本文的实现过程懂了,但是实现去雾…

缝纫机牙架的数控工艺工装设计与编程

目 录 绪 论 1 2.差动牙架的工艺设计 3 2.1 机械加工工艺规程概述 3 2.2.1 零件的技术条件 4 2.2.2 加工表面及其要求 5 2.2.3零件的材料 6 2.3毛坯的选择 6 2.3.1毛坯的种类 6 2.4 基准的选择 8 2.5 机械加工工艺路线的拟订 10 3 差动牙架的工装设计 17 3.1 夹具概述 17 3.2 …

牛客CM11 - 链表分割【环形链表雏形】

看来真的不能乱割呀~一、题目描述二、思路分析三、代码详解【保姆级教学】四、环形链表的疑难解惑五、整体代码展示六、总结与提炼一、题目描述 描述 现有一链表的头指针 ListNode* pHead,给一定值x,编写一段代码将所有小于x的结点排在其余结点之前&am…

数据库-范式

目录 完全函数依赖部分函数依赖传递函数依赖码主属性非主属性第一范式(1NF)第二范式(2NF)第三范式(3NF)例题完全函数依赖 每一个属性都有用,缺一个都不能决定。 部分函数依赖 部分属性用不到,也可以决定 传递函数依赖

抽象类和(上)

大家好,又见面了,今天和大家浅谈一下抽象类 抽象类存在的意义就是被继承 抽象类 🐷1.抽象类的定义 🐱‍🚀2.抽象类的语法 💚3.抽象类的概念 🚀4.抽象类的作用 1.抽象类的概念 什么是 好…