模式识别与机器学习 第一章:绪论

news2025/7/21 13:48:08

一、基础概念

  • 样本: 所研究对象的单个个体、实例。
  • 样本集: 若干样本的集合。
  • 类或类别: 在所有样本上定义的一个子集,处于同一类的样本具有相似的性质,即具有相同的模式。
  • 特征: 用于表征样本的观测,也称属性。通常是数值表示的某些量化特征,如果存在多个特征,则它们就组成了特征向量。样本的特征构成了样本的“特征空间”,空间的维数就是特征的个数,而每一个样本就是特征空间中的一个点。
  • 已知样本: 事先知道所属类别的样本。
  • 未知样本: 特征已知,但类别未知的样本。
  • 模式识别: 用计算的方法根据样本特征将样本划分到一定的类别。

二、模式识别的主要方法

  • 基于知识的方法: 根据人们已知的关于研究对象的知识,整理出若干描述特征与类别间关系的准则,建立一定的计算机推理系统,对未知样本通过这些知识推理决策其类别。
  • 基于数据的方法: 确定了样本所采用的特征后,不是依靠人们对所研究对象的认识来建立分类系统,而是收集一定数量的已知样本,用这些样本作为训练集(training set)来训练一定的模式识别机器,使之在训练后能够对未知样本进行分类。
    在这里插入图片描述

G表示从对象观测特征的过程,特征用向量x表示,y表示对象的性质,S表示决定x和y之间关系的系统,它存在但我们不知道其内部机理(如果知道就可采用基于知识的方法)。首先得到一定数量的已知样本,即一定数量的x和对应的y的数据对{(x, y)}。基于数据的模式识别就是利用这样的训练样本来训练学习机器LM,也就是建立实现从特征向量x判断类别y’的一个数学模型,用来对未知样本计算(预测)其类别。

基于数据的方法是模式识别最主要的方法,具体任务可以描述为:在类别标号y与特征向量x存在一定的未知依赖关系,但已知的信息只有一组训练数据对{(x, y)}的情况下,求解定义在x上的某一函数y’= f(x),对未知样本的类别进行预测。这一函数叫做分类器(classifier)。

三、监督模式识别和非监督模式识别

  • 监督模式识别: 在模式识别问题中,需要已知要划分的类别,并且能够获得一定数量的类别已知的训练样本。
  • 非监督模式识别: 事先并不知道要划分的是什么类别,更没有一定数量的类别已知的样本用作训练,甚至不知道有多少类别。需要做的是根据样本特征将样本聚成几个类,使属于同一类的样本在一定意义上是相似的,而不同类之间的样本则有较大差异。所得到的类别称作聚类。

四、模式识别的应用

  • 语音识别: 识别说话语句的含义,如电话中的语音助手。
  • 说话人识别: 识别说话人的身份,如苹果的Siri。
  • 字符和文字识别: 识别符号或文字,如图片提取文字。
  • 复杂图像中特定目标识别: 识别具体目标。如监控中违章车辆的识别。

五、模式识别系统的典型构成

特征提取与选择、分类器设计或聚类分析、分类器或聚类结果的性能评价方法,是各种模式识别系统中具有共性的步骤,是整个模式识别系统的核心。

在这里插入图片描述

  • 特征提取与选择: 得到已知样本,对样进行预处理,获取可能与样本分类有关的观测向量(原始特征)。为了更好地进行分类,可能需采用一定的算法对特征进行再次提取和选择。
  • 分类器设计(训练): 选择分类器方法,用已知样本进行分类器训练。
  • 分类决策(识别): 利用一定的算法对分类器性能进行评价,对未知样本实施同样预处理和特征提取与选择,用所设计的分类器进行分类。
    在这里插入图片描述
  • 特征提取与选择: 得到已知样本,对样进行预处理,获取可能与样本分类有关的观测向量(原始特征)。为了更好地进行聚类,可能需要采用一定的算法对特征进行再次提取和选择。
  • 聚类(自学习): 选择非监督模式识别方法,用样本进行聚类分析。
  • 结果解释: 检验聚类结果的性能,分析所得聚类与研究目标之间的关系,分析结果的合理性,对聚类的含义给出解释;如果有新样本,把聚类结果用于新样本分类。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/17089.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于帧间差分法的视频目标检测研究-含Matlab代码

⭕⭕ 目 录 ⭕⭕✳️ 一、引言✳️ 二、帧间差分算法原理✳️ 三、视频目标检测系统✳️ 四、参考文献✳️ 五、Matlab代码获取✳️ 一、引言 随着科技的发展、社会的进步、人民生活水平的提高,团体和个人的安防意识都在不断增强,视频监控系统也就得到了…

深入浅出 C++ 11 右值引用

彻底搞清楚:右值引用/移动语义/拷贝省略/通用引用/完美转发 —— 以最短的篇幅,介绍常见误解(什么时候要用 move?什么时候不能 move?为什么 move 失败?)和基础知识(为什么右值引用变…

魔性洗脑神曲掀起模仿热潮,品牌为何热衷“打歌”?

【潮汐商业评论/ 原创】 抖音、快手、B站等社交媒介是品牌推广绕不开的阵地,围绕这些平台,一些品牌在“打歌”路上越走越远——通过几何级增长的播放量,使品牌定制曲迅速蹿红,成为“神曲”。这些定制曲仿佛自带魔力,不…

甘露糖-聚乙二醇-叠氮,mannose-PEG-N3,叠氮-PEG-甘露糖

甘露糖-聚乙二醇-叠氮,mannose-PEG-N3,叠氮-PEG-甘露糖 叠氮化合物是一类含有三个氮相连结构的化合物,一般用RN3表示。叠氮化合物是电子传递系统的抑制剂,能与细胞色素形成配位化合物,阻止细胞色素氧化酶氧化型a3组分…

【附源码】Python计算机毕业设计双笙映画

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

四则运算Java版

数据结构之栈的应用之四则运算_文丑颜不良啊的博客-CSDN博客 之前有写过一篇关于栈的应用之四则运算的文章,是用 C 写的,涉及到一些指针的操作,同时,那篇文章有一个致命的错误,就是只支持 10 以内的混合运算&#xff…

STM32微控制 -STM32命名规则-STM32寄存器缩写列表-STM32存储器和总线架构

STM32使用说明第一篇【1】STM32微控制器【2】STM32命名规则【3】STM32寄存器缩写列表【4】STM32存储器和总线架构【1】STM32微控制器 STM32是一个微控制器产品系列的总称,目前这个系列中已经包含了多个子系列,分别是: 【1】STM32小容量产品 【…

操作系统基础教程——第五章课后作业答案

1.思考题 (3)什么是文件的逻辑结构?它有哪几种组织方式? 文件的逻辑结构(逻辑文件):独立于物理环境的,用户概念中的抽象信息组织方式,用户能观察到的,并加以处理的数据…

[datawhale202211]跨模态神经搜索实践:跨模态模型

结论速递 本次任务首先了解了CLIP模型及其原理,CLIP模型将图像标签替换为图像的文本描述信息,来监督视觉任务的训练,引入了语义匹配实现下游任务的zero-shot。 多模态和跨模态可能是未来模型的发展方向,多模态尝试结合不同信息表…

数字集成电路设计(四、Verilog HDL数字逻辑设计方法)(三)

文章目录4. 有限同步状态机4.1 编码4.2 有限状态机的写法4.3 举例4.3.1 用Verilog HDL 设计顺序脉冲发生器4.3.2 设计-个自动售报机报纸价钱为八角,纸币有 1角、2 角5 角、一元。该自动售报机不考虑投币为大额面值等特殊情况4. 有限同步状态机 !&#xf…

『Java』类和对象

文章目录一、面向对象的初步认识🌳1、什么是面向对象🌳2、面向对象与面向过程🍑(1)洗衣服🍑(2)大象装冰箱汽车拼装二、类定义和使用🌳1、简单认识类🌳2、类的…

网络安全重点知识

单选(抽20个)、判断(抽5个) 第二章: 第三章: 第四章: 第五章: 第六章: 第八章: 填空(抽3个) 1、网络安全: 是在网络各个…

【附源码】Python计算机毕业设计税务综合信息平台

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

jquery基础--学习笔记

jQuery选择器 元素、Class、id选择器 属性选择器 注意:!如果不指定标签,会输出所有的html标签不满足的元素 如何指定?可以用之前的元素、标签或者id选择器 层级选择器 上面图片写错了,box应该是div,看例子…

【微信小程序】数据绑定

🏆今日学习目标:第十一期——数据绑定 😃创作者:颜颜yan_ ✨个人主页:颜颜yan_的个人主页 ⏰预计时间:25分钟 🎉专栏系列:我的第一个微信小程序 文章目录前言实现数据绑定初始化数据…

[附源码]java毕业设计农村留守儿童帮扶系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

Flink cdc 2.3.0 日前发布,支持众多新特性

新连接器 2.3.0 新增了 DB2 CDC 连接器 增量快照迎来新的连接器成员 2.3.0 版本MongoDB CDC,Oracle CDC 两大连接器均支持了增量快照,实现无锁读取并发读取断点续传 优化 2.3.0 版本 MySQL CDC 连接器性能和稳定性大幅提升 Flink 支持 2.3.0 版本…

11月19日绿健简报,星期六,农历十月廿六

11月19日绿健简报,星期六,农历十月廿六1. 文旅部:不随意关停娱乐场所,无疫情发生地原则上不限制大型经营性演出观众人数。2. 人社部等五部门:企业不得以年龄为由“一刀切”清退大龄农民工。3. 英国政府以国家安全为由&…

Java 枚举(Enum)使用

文章目录枚举引入enum关键字实现枚举enum关键字实现枚举注意事项enum常用方法一览表enum课堂练习enum实现接口枚举引入 创建Season类, 实例化春夏秋冬四个实例 Season对象有如下特点 1.季节的值是有限的几个值(spring, summer, autumn, winter) 2.只读,不需要修改…

开始数据治理时三个常见的陷阱和解决方法

当我们与客户合作帮助他们提高数据管理能力时,大多数部门都同意更好的数据治理将有助于解决他们的数据问题。然而,我们发现数据治理很少是优先事项,而且往往被搁置一旁,去支持更紧迫的业务工作。这有点像使用牙线——当你在牙医诊所时很容易获得动力,但当你回到家时很难保…