计算机视觉的监督学习与无监督学习

news2025/7/20 6:08:08


什么是监督学习?


监督学习是一种机器学习算法,它从一组已标记的 合成数据生成器中生成的训练数据中学习。这意味着数据科学家已经用正确的标签(例如,“猫”或“狗”)标记了训练集中的每个数据点,以便算法可以学习如何预测不可预见数据的结果并准确识别新图像数据中的对象。

监督学习算法的典型计算机视觉任务包括目标检测、视觉识别和分类。

①、在目标检测中,监督学习算法用于学习如何识别和定位图像中的对象。

②、在图像识别中,监督学习算法用于学习如何从一组图像中识别特定对象类别(例如,“人”、“汽车”等)。

③、在图像分类中,监督学习算法用于学习如何为图像分配类标签(例如,“猫”、“狗”等)。

监督学习的例子是什么?

监督学习中常见的算法和技术包括神经网络、支持向量机 (SVM)、逻辑回归、随机森林或决策树算法。

无监督机器学习的工作原理

无监督训练过程中的步骤如下:

1、收集数据: 通过合成数据生成器 收集相关数据。例如,如果要构建一个无监督机器学习模型来对动物图像进行分组,则需要一个图像数据集,该数据集已手动分类到包含狗、猫、鸟等图片的文件夹中。但是,需要注意的是,如果正确标记数据,无监督学习算法产生的结果质量可以大大提高。

2、训练模型:该模型学习将相似的项目组合在一起或在数据中查找模式。

3、评估模型: 每次训练迭代后,都必须评估模型性能,以了解它在未查看和未标记的数据上的表现。

4、部署模型: 当模型性能足够好时,可以将其部署到实际应用程序中。  

智慧城市中的计算机视觉和深度学习

监督学习与无监督学习的主要区别

在下文中,我们将讨论监督学习与无监督学习之间的区别。监督式机器学习技术和无监督式学习模型之间存在根本的特征差异,这些差异决定了它们在特定用例中的有用性。  

监督学习和无监督学习的区别:输入数据

这些机器学习方法之间的最大区别在于,监督学习需要预先收集训练数据,收集训练数据可以使用合成数据生成器,而无监督学习则不需要。因此,监督学习需要大量的前期人工干预才能适当地标记数据。

例如,在计算机视觉中,注释者在图像中标记数万到数百万个数据点。数据选择和标注精度对机器学习模型性能的影响很大。虽然这有助于训练高效的机器学习模型,但存在偏差风险,并且算法只有在精确定义的条件下以及与训练数据非常相似的数据才能很好地运行。  

机器学习技术适用于不同的任务

监督学习用于分类和回归任务,而无监督学习用于聚类和降维任务。

监督式学习算法通过从合成数据生成器 来生成合成训练数据集进行泛化来构建模型。目标是正确标记算法以前从未见过的新数据点。例如,您可以使用监督学习进行图像分类,其中算法学习将数据分类为不同的类别(例如,狗与猫)。监督学习算法将从狗和猫的标记图像中学习,然后能够正确地标记以前从未见过的新图像。

另一方面,无监督学习算法试图在数据中寻找隐藏的模式或内在结构。它不需要标记数据;相反,它根据相似性将数据点分组在一起。例如,您可以使用无监督学习进行图像分割,其中算法尝试查找图像中不同对象之间的边界。

监督学习与无监督学习的复杂性

监督学习更容易实现,因为它有一个特定的目标——学习如何将输入数据映射到目标输出。无监督学习虽然也有明确的目标,但没有它试图实现的特定输出,而是更专注于理解数据的底层结构。  

监督学习通常更昂贵

监督学习和无监督学习之间的另一个区别是,监督学习比无监督学习更昂贵。这是因为训练监督学习模型需要收集和标记数据,这些数据可以借助合成数据生成器 来生成。

一般来说,需要对大量输入数据进行数据收集和注释才能达到预期的效果,尤其是在具有高度可变对象(例如人)的现实世界环境中。另一方面,训练无监督学习模型不需要数据科学家团队手动标记原始数据。  

监督学习在计算机视觉中更准确

最后,监督学习通常比无监督学习更准确。这是因为监督式机器学习算法具有可供学习的训练数据集,而无监督式学习算法则没有。

训练深度神经网络需要对模型进行多次迭代和持续优化 (MLOps),以提高模型从未探索的数据(验证数据集)预测推理结果的能力。在大多数情况下,监督方法可以获得更准确的结果。

监督学习和无监督学习的实际应用?

无监督学习算法用于各种应用,从医学诊断到股票市场预测。一般来说,监督学习比无监督学习更广泛地使用,因为它需要更少的数据,并且更容易实现,因为输出数据是预定义的。

然而,无监督学习有其自身的优势,例如更能抵抗过拟合(卷积神经网络的一大挑战),并且能够更好地从复杂的大数据中学习,例如没有固有结构的客户数据或行为数据。  

监督学习应用示例

1、物体识别: 监督学习算法可用于对图像或视频中的对象进行定位和分类(视频识别)。它们还可用于识别计算机视觉系统中的人员、车辆和其他物体。

公共场所遗弃物检测

2、文本识别: 监督学习算法可用于读取图像或视频中的文本。光学字符识别 (OCR) 系统将书面文本转换为机器可读的形式,例如,使用 AI 读取车牌或扫描文档。 具有车牌识别功能的 OCR 应用程序。

3、人脸识别:人脸识别使用在数据库上训练的深度神经网络来识别图像或视频中的人脸。该技术用于安全应用,例如解锁手机或进入建筑物。有关更多示例,请查看 DeepFace,一个流行的人脸识别库。

4、目视检查: 机器学习模型用于检查生产线上的产品是否存在工业制造中的缺陷。这是通过训练监督式机器学习模型来完成的,该模型使用标记的训练数据区分有缺陷和无缺陷的项目。

视觉缺陷检测在制造业中的应用

无监督学习的实际应用

1、异常检测: 异常检测是识别数据集中异常值的过程。这可用于欺诈检测、识别数据中的错误以及发现异常模式。这种大数据分析对于保险和金融行业识别可疑交易和检测内幕交易非常重要。

2、 语音识别: 在自然语言处理(NLP)和自然语言理解(NLU)领域,无监督学习对于提高对单词和短语上下文的理解非常重要。

3、文本情感分析: 算法可用于情感分析,根据人们对文字、表情符号和表情符号的使用来了解人们对某事的感受。这些方法用于分析社交媒体数据中抑郁检测的情绪水平。

4、客户角色: 聚类分析用于将相似的数据点组合在一起。这可用于营销、客户细分以及根据客户和买家的行为识别客户和买家档案。

5、医学影像: 无监督方法允许机器自行学习,以识别监督学习可能无法发现的模式和异常。它还可用于分割图像,以便识别单个对象。这在医学图像中特别有用,因为小细节可以产生很大的不同。

6、时间序列分析: 时间序列数据是以固定间隔间隔的数据点序列。无监督学习可用于查找时间序列数据中的模式,并根据未标记的数据对未来事件进行预测。这对于天气预报、销售预测、股票市场预测和预测交通模式等非常重要。  

总结

监督方法和非监督方法之间的最大区别在于,监督模型需要标记输入。通过监督学习,我们向机器提供已知信息,以便它可以学习找到这些模式并做出预测。无监督学习采用未标记的数据集,并尝试自动识别其中的结构和模式。

监督学习的好处是,您可以训练模型,使其在解决输出选项有限(分类问题)的明确指定问题时更加准确。无监督学习更具探索性,不需要预先标记的数据,使其更加灵活。它可用于细分客户、查找关系和检测异常。

监督学习和无监督学习都是机器学习工具箱中用于数据分析的重要工具。决定使用哪一个取决于您尝试解决的问题的性质以及可用的数据量和类型。

转载:计算机视觉的监督学习与无监督学习 (mvrlink.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1157412.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

NFC芯片MS520:非接触式读卡器 IC

MS520 是一款应用于 13.56MHz 非接触式通信中的高集成 度读写卡芯片。它集成了 13.56MHz 下所有类型的被动非接触 式通信方式和协议,支持 ISO14443A 的多层应用。 主要特点 ◼ 高度集成的解调和解码模拟电路 ◼ 采用少量外部器件,即可将输…

Python 算法高级篇:最小生成树算法的优化与应用

Python 算法高级篇:最小生成树算法的优化与应用 引言 1. 最小生成树问题简介2. Prim 算法3. Kruskal 算法4. 优化与比较5. 案例应用:通信网络设计6. 总结 引言 最小生成树( Minimum Spanning Tree , MST )是图论中的一…

thymeleaf无法加载resources中的静态资源

springbootthymeleaf整合无法加载resources中的静态资源异常处理 打包编译项目,显示找不到js、css等静态资源 重新编译项目加载资源,还是找不到 修改pom.xml资源配置文件 如果设置编码还是打包失败,或者显示找不到js、css、html等静态资源…

Linux 下C++工程编译

创建文件夹 #include<iostream> using namespace std;int main(){cout<<"THis is C program Process!"<<endl;}编译执行命令&#xff1a; g test.cpp -o test实际上&#xff0c;上述的命令包含了如下的四个过程&#xff1a; 1. 预处理 g -E …

【Redis】Redis常用命令-getsetkeysexistsexpirettltype

文章目录 读取文档注意事项set命令get命令全局/通用命令KEYSEXISTSDELEXPIRETTLTYPE 读取文档注意事项 官方文档链接&#xff1a;https://redis.io/ 注意&#xff1a;redis的命令不区分大小写 在redis文档给出的语法格式说明&#xff1a; []&#xff1a;相当于一个独立的单元&a…

(免费领源码)Java#ssm#MySQL高校知识共享系统设计与实现35050-计算机毕业设计项目选题推荐

摘 要 信息化社会内需要与之针对性的信息获取途径&#xff0c;但是途径的扩展基本上为人们所努力的方向&#xff0c;由于站在的角度存在偏差&#xff0c;人们经常能够获得不同类型信息&#xff0c;这也是技术最为难以攻克的课题。针对高校知识共享系统等问题&#xff0c;对高校…

uniapp-自定义表格,右边操作栏固定

uniapp-自定义表格&#xff0c;右边操作栏固定 在网上找了一些&#xff0c;没找到特别合适的&#xff0c;收集了一下其他人的思路&#xff0c;基本都是让左边可以滚动&#xff0c;右边定位&#xff0c;自己也尝试写了一下&#xff0c;有点样式上的小bug&#xff0c;还在尝试修…

香港金融科技周2023:AIGC重塑金融形态

10月31日&#xff0c;由香港财经事务及库务局与投资推广署主办的“香港金融科技周2023大湾区专场”盛大启幕。中国AI决策领先企业萨摩耶云科技集团创始人、董事长兼 CEO林建明受邀参加圆桌会议&#xff0c;与中国内地、香港以及全球金融科技行业顶尖人才、创新企业、监管机构和…

Apache Shiro 越权访问漏洞 CVE-2020-1957 漏洞复现

一、漏洞描述 Apache Shiro 是一款开源安全框架&#xff0c;提供身份验证、授权、密码学和会话管理。Shiro框架直观、易用&#xff0c;同时也能提供健壮的安全性。 CVE-2020-1957&#xff0c;Spring Boot中使用 Apache Shiro 进行身份验证、权限控制时&#xff0c;可以精心构造…

Java入门必刷的基础题1(八道)

目录 1. 第一题 2. 判定一个数字是否是素数 3. 打印 1 - 100 之间所有的素数 4. 输出 1000 - 2000 之间所有的闰年 5. 输出乘法口诀表 6. 求两个正整数的最大公约数 7. 求二进制中 1 的个数 8.分别输出二进制中的奇数位和偶数位 下面的源码大多只有方法体&#xff0c;需…

玩家必备,2款顶级游戏录屏软件!

“游戏怎么录屏呀&#xff1f;最近迷上了网游&#xff0c;觉得自己的游戏技术挺厉害的&#xff0c;想把游戏视频录下来出一个教程&#xff0c;方便给朋友进行参考&#xff0c;但是我不会录屏&#xff0c;大家有没有游戏录屏的软件或者方法推荐一下。” 随着游戏产业的飞速发展…

用二维码搭建设备巡检系统,轻松实现扫码巡检和数字化台账

针对设备状态不透明、纸质记录效率低、故障报修不及时等设备点巡检的常见问题&#xff0c;可以在草料二维码上自主搭建涵盖点检、巡检、报修、维修、保养等功能的管理系统&#xff0c;无需安装APP&#xff0c;微信扫码就能查看设备档案、用表单替代纸质检查表。 譬如“台州沿海…

什么是威廉姆斯的三维结构?澳福详解作用

从心理学视角出发&#xff0c;威廉姆斯将市场视为一个三维结构&#xff0c;包含了时间、价格与交易者的心理三大组成部分。他提出的成功交易策略是“随波逐流&#xff0c;乘风破浪&#xff0c;随波逐流”。为了培养这种思维方式&#xff0c;交易者应学会如何将自身的观念、观点…

虹科示波器 | 汽车免拆检修 | 2012 款上汽大众帕萨特车 发动机偶尔无法起动

一、故障现象 一辆2012款上汽大众帕萨特车&#xff0c;搭载CFB发动机&#xff0c;累计行驶里程约为12万km。车主反映&#xff0c;将点火开关置于起动挡&#xff0c;偶尔只能听到“咔哒”一声&#xff0c;起动机没有反应&#xff0c;类似蓄电池亏电时起动发动机的现象。为此&…

AI 革命:最佳 txt 转纹理工具

推荐稳定扩散AI自动纹理工具&#xff1a; DreamTexture.js自动纹理化开发包 游戏产业和人工智能革命 随着人工智能革命迎来一个具有无可比拟潜力的新时代&#xff0c;游戏行业正处于巨大转变的边缘。随着开发人员利用人工智能的力量&#xff0c;他们正在解锁创新方法来增强游戏…

2023年测试工程师想进BAT必须具备的几项素质!

我发现一个奇怪的现象&#xff1a;总是听到身边的程序员朋友谈论BAT&#xff08;中国大陆互联网的三大巨头&#xff1a;百度、阿里、腾讯&#xff09;以及如何进入BAT&#xff0c;却鲜少有测试会去谈论或者考虑这些问题。 我不知道这是为什么&#xff0c;或者我就算知道也只是…

剑指Offer || 084.全排列||

题目 给定一个可包含重复数字的整数集合 nums &#xff0c;按任意顺序 返回它所有不重复的全排列。 示例 1&#xff1a; 输入&#xff1a;nums [1,1,2] 输出&#xff1a; [[1,1,2],[1,2,1],[2,1,1]]示例 2&#xff1a; 输入&#xff1a;nums [1,2,3] 输出&#xff1a;[[1…

【Git】Git使用指南+上传项目踩坑总结

记录Git 使用和命令解读&#xff1a; git init git add .git commit -m "first commit"git branch -M maingit remote add origin https://github.com/xxx.gitgit push -u origin main 这是最经常用到的使用 git上传项目的代码&#xff0c;值得注意的是&#xff0c…

进程间通信(IPC)

进程间通信概述 进程间通信是指不同进程之间交换或传播信息。进程间通信的方式通常有管道通信、消息队列、信号量、共享存储、Socket、Stream等&#xff0c;其中Socket和Stream支持不同主机上的两个进程间的通信。 管道&#xff08;无名管道&#xff09;&#xff1a; 管道通信…

无需频繁登录支付宝网站即可完成商家转账,实时到账,方便安全快捷

大家好&#xff0c;我是小悟 转账到支付宝账户是一种通过 API 完成单笔转账的功能&#xff0c;支付宝商家可以向其他支付宝账户进行单笔转账。 商家只需输入另一个正确的支付宝账号&#xff0c;即可将资金从本企业支付宝账户转账至另一个支付宝账户。 该产品适用行业较广&am…