机器学习(1)机器学习的概念与应用领域

news2025/5/24 16:07:41

文章目录

    • 一、前提
    • 二、机器学习的概念与应用领域
      • 1.认识
        • ①亚瑟•塞缪尔的定义
        • ②汤姆·米切尔的定义
      • 2.相关术语
        • 数据术语
        • 训练模型术语
        • 获得模型后术语
      • 3.应用领域
        • 语音识别
        • 计算机视觉
        • 自然语言处理
          • ①自然语言分析
          • ②自然语言生成
        • 大数据分析

一、前提

Python语言具有数量庞大且功能相对完善的标准库和第三方库,通过对这些库的引用,能够实现不同领域业务的开发。然而,由于库的数量庞大,安装、管理这些库,以及对库进行及时升级维护成为一件复杂的事情。因此,找到“已经集成好必要库的Python开发环境”就变得尤为重要。

Anaconda集成了包含NumPy、SciPy、Pandas、Matplotlib、Scikit-learn等机器学习常用库在内的180多个工具包,使用Anaconda可一次性安装Python开发环境及大量的第三方库。

使用Anaconda搭建机器学习开发环境的具体步骤分解如下

  • 第 1 步:下载Anaconda,从Anaconda的官方网站或者国内镜像站点下载Anaconda软件包。

    Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

  • 第2步:双击下载好的Anaconda安装程序,根据安装步骤完成Anaconda的安装。

  • 第3步:启动Jupyter Notebook,使用Jupyter Notebook编辑、运行和调试程序。(pycharm也是可以的)

二、机器学习的概念与应用领域

1.认识

在学术界,机器学习还没有一个公认且准确的定义。

①亚瑟•塞缪尔的定义

机器学习是一个研究领域,让计算机无须进行显著式编程就具备学习能力。
什么是“显著式编程”?举例说明,假如要让计算机识别菊花和玫瑰花,人为地告诉计算机菊花是黄色的,玫瑰花是红色的。那么,计算机“看到”黄色的花就认为是菊花,“看到”红色的花就认为是玫瑰花,这样的编程方式就是“显著式编程”。
但是,如果给计算机一批菊花的图片和一批玫瑰花的图片,然后编写程序,让计算机自己总结出识别菊花和玫瑰花的规律,再来辨认菊花和玫瑰花。这种让计算机自己总结规律的编程方式是“非显著式编程”

②汤姆·米切尔的定义

一个计算机程序被称为可以学习,是指它针对某个任务T和某个性能指标P,能够从经验E中去学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高。在识别菊花和玫瑰花的例子中,任务T就是编写计算机程序识别菊花和玫瑰花;经验E就是给计算机输入一批菊花和玫瑰花的图片;而性能指标P可以认为是能正确识别菊花和玫瑰花的概率。

综合分析学者们的描述,机器学习可以这样理解

机器学习(machine learning, ML)是研究计算机怎样模拟或实现人类的学习行为,以获取新知识或技能的技术,是一门通过编程让计算机从数据中进行学习的科学。

2.相关术语

数据术语

① 机器学习的基础是大量的数据,具有相似结构的数据样本集合称为数据集
② 数据集的每条记录是关于一个事件或对象的描述,称为一个样本或示例;
③ 反映事件或对象在某方面的表现或性质的事项,称为特征属性;(类)
④ 属性上的取值称为特征值属性值;(对象)
⑤ 描述样本特征参数的个数称为维数

训练模型术语

① 从数据中学习得到模型的过程称为训练学习
② 训练过程中使用的数据称为训练数据,每个样本称为训练样本,训练样本组成的集合称为训练集
③ 为得到效果最佳的模型,用来调整模型参数的样本称为验证样本,验证样本组成的集合称为验证集

获得模型后术语

① 使用模型对未知数据进行预测的过程称为测试,用于预测的样本称为测试样本,测试样本组成的集合称为测试集;
② 模型适用于新样本的能力,称为泛化能力

3.应用领域

技术的不断进步,使得机器学习的应用领域越来越宽广,应用效果也越来越显著。总体来说,机器学习的应用主要集中在语音识别计算机视觉自然语言处理、与大数据分析等领域。

语音识别

语音识别是让机器理解人说话的声音信号,并将其转换成文字的过程,它是机器学习较早的应用领域。

语音识别算法是语音输入法、人机对话系统等应用的关键技术。

计算机视觉

计算机视觉是研究如何让机器“看”的科学。

目前常用的计算机视觉技术包含人脸识别、指纹识别、车牌识别等。其目的在于使用计算机代替人眼,对目标进行识别、跟踪,以及估计目标的大小与距离等。

自然语言处理

自然语言处理是计算机科学与语言学相结合而产生的一个应用领域,主要研究使用电子计算机模拟人的语言交际过程,使计算机能理解和运用人们生活中使用的自然语言,实现人机之间的自然语言通信,从而进一步实现计算机代替人进行部分脑力劳动的目标。

其中,部分脑力劳动主要包括查询资料、解答问题、摘录文献、汇编资料,以及一切与自然语言信息有关的加工处理。

①自然语言分析

包括分词方法、命名实体识别、句法分析、语义分析等方面的研究,这些方面的研究都以机器学习技术为基础,如对分词方法的研究会涉及隐马尔可夫模型;

②自然语言生成

是将存储于计算机中的数据转化为人们能够理解的自然语言.如GTP大语言模型

大数据分析

机器学习与大数据的结合将产生巨大的价值。目前,机器学习技术已经在电子商务、互联网金融、旅游推荐、社交网络分析等众多行业和领域中得到广泛应用。

例如,在金融领域,银行可利用机器学习技术,对消费者的刷卡数据进行统计和分类,从而获得消费者的消费习惯、消费能力和消费偏好等具有商业价值的数据信息,向消费者精准推荐各种服务(如理财或信贷服务);电信行业可以借助以机器学习为基础的大数据处理软件,对用户信息进行处理,从而得到能够查询客户信用情况的数据,使得第三方企业可以凭借这些数据信息制订市场分析报告或对目标客户群体的行为轨迹进行分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1528506.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

记录一次爬虫接单项目【采集国际淘宝数据】

1.背景 前几天接了一个爬虫的单子,上周六已经完成这个单子,也收到了酬劳(数目还不错,哈哈哈,小喜了一下)。这个项目大概我用了两天写完了(空闲时间写的)。 2.介绍 大概要采集的数据…

Flutter-仿淘宝京东录音识别图标效果

效果 需求 弹起键盘,录制按钮紧挨着输入框收起键盘,录制按钮回到初始位置 实现 第一步:监听键盘弹起并获取键盘高度第二步:根据键盘高度,录制按钮高度计算偏移高度,并动画移动第三步:键盘收起…

深度学习_卷积

卷积 卷积(Convolution)是数学和计算机科学中的一个重要概念,特别在信号处理和图像处理中应用广泛。在信号处理领域,卷积是两个函数之间的一种数学操作,它表示两个函数的重叠部分的积分量。 在图像处理中&#xff0c…

KKVIEW远程: TODESK退出了还能远程吗

Todesk退出了还能远程吗 当我们谈论Todesk或其他远程桌面软件时,一个经常被提及的问题是:当我退出Todesk后,是否仍然可以远程访问我的计算机?为了回答这个问题,我们首先需要了解Todesk的工作原理和远程访问的基本条件…

WhatsApp商业推广有哪些推广技巧?

在现代化商业,与用户创造紧密、良好的互动体验,建立强大的品牌形象以及找到最佳的推广途径,变得尤为重要。而WhatsApp作为全球使用最广泛的即时通讯应用之一,成为无数企业选择优选的推广平台。那么,在WhatsApp商业推广…

图书推荐|西门子S7-1200 PLC编程与应用实例

一线资深工程师的全彩版PLC实战教程,软硬件及编程全方位详解(配视频教学) 本书内容 《西门子S7-1200 PLC编程与应用实例》对西门子S7-1200 PLC的硬件和编程软件的功能进行详细讲解,内容包括PLC编程基础、博途TIA软件入门、指令介…

使用OCC进行切割操作

OCC中切割操作以一个平面作为切割面,对物体进行切割操作 //要操作的图形 TopoDS_Shape shape getHanleShape(); //构造切割面 TopoDS_Shape faceShape getSplitterFace(); //切割操作 BOPAlgo_Splitter splitter; splitter.AddArgument(shape); splitter.AddTool(…

13.Python从入门到精通—Python 集合操作与方法概览

13.Python从入门到精通—Python 集合操作与方法概览 Python 集合集合的基本操作1、添加元素2、移除元素3、计算集合元素个数4、清空集合5、判断元素是否在集合中存在 集合内置方法完整列表 Python 集合 在Python中,集合是一种无序、不重复的数据类型。集合通常用于…

unicloud快速上手,unicloud项目创建以及项目创建注意事项

uniCloud快速上手 本项目地址https://gitee.com/qayrup/unicloud-demo 创建unicloud项目 新建一个uni项目,并选择启用unicloud,选择阿里云或腾讯云 阿里云和支付宝云都支持一个月免费的云,如果只想体验啥的,可以选择这两个, 但是需要注意,支付宝云需要配置跨域,否则很多云函…

0基础学习VR全景平台篇第145篇:图层控件功能

大家好,欢迎观看蛙色VR官方——后台使用系列课程!这期,我们将为大家介绍如何使用图层控件功能。 一.如何使用图层控件功能? 进入作品编辑页面,点击左边的控件后就可以在右边进行相应设置。 二.图层控件有哪些功能&am…

C++有关内存的那些事

个人主页:PingdiGuo_guo 收录转栏:C干货专栏 前言 本篇博客是讲解关于C内存的一些知识点的。 文章目录 前言 1.内存函数 1.1memcpy函数 1.2memmove函数 1.3 memset函数 2.各数据类型占用 2.1bool类型 2.2char类型 2.3short、int、long类型及整数…

英语广场杂志英语广场杂志社英语广场编辑部2024年第3期目录

英语翻译理论与实践 浅析钱钟书“化境论”与文言文英译的适配度 冯睿;姚锦宁;李佳彧; 3-6《英语广场》投稿:cn7kantougao163.com 目的论视角下《写作、阅读和演讲的艺术》的翻译分析报告 张俊怡; 7-10 新加坡籍译者温宏文翻译行为研究 周梦; 11-14 …

CVE-2024-24112 XMall后台管理系统 SQL 注入漏洞分析

------作者本科毕业设计项目 基于 Spring Boot Vue 开发而成...... [Affected Component] /item/list /item/listSearch /sys/log /order/list /member/list (need time-based blind injection) /member/list/remove 项目下载地址 Exrick/xmall: 基于SOA架构的分布式…

百年难遇:3款良心好用的国产软件,常被误以为是外国佬开发

许多出色的国产软件,但由于某些特殊原因,我们常常错过了它们。 今天,笔者将向大家推荐三款电脑必备的软件,每一款都堪称神器。 Teamind Teamind是一款功能强大的在线白板工具,支持多人协作,成为众多居家…

收银软件多少钱一套?亿发全面解析超市收银系统软件价位

当超市经营达到一定规模时,商户通常会选择配置收银系统软件,以提升收银效率和为顾客提供更完善的购物体验。然而,人们常问:收银系统软件一套需要多少钱?安装一个收银系统又需要多少费用呢?了解收银系统软件…

JDK1.8安装环境变量配置检测是否安装成功

前言 目前市面上最常用的还是java1.8和Mysql5.7(企业)2024 安装包 已上传CSDN,审核中 JDK安装细节 注:如果怕麻烦就直接安装在C盘(默认) 环境变量配置 Win10打开左下角图标点击系统,下滑点…

ET框架新起一个服务及实现服务之间的消息通讯

ET框架是熊猫大大写的双端框架,游戏客户端和服务端都是用C#语言来编写 新起一个服务名比如叫做Activity 1.配置文件StartSceneConfig 2. SceneFactory switch (scene.SceneType) {case SceneType.Activity:break; } 定义SceneType枚举类型 public enum SceneTyp…

计算机网络——物理层(物理传输介质和物理层的设备)

计算机网络——物理层(物理传输介质和物理层的设备 物理传输介质导向性传输介质双绞线同轴电缆光纤 非导向性传输介质无线电波多径效应 微波地面微波通信ISM 频段 卫星通信 物理层设备中继器集线器中继器和集线器的区别 我们今天进入物理层的物理传输介质和物理层的…

【原创】手动安装open-webui,非官方docker安装方法,可汉化ui

open-webui是一个为LLMs(大型语言模型)设计的友好型Web用户界面,支持Ollama和OpenAI兼容的API。它提供了直观的聊天界面、响应式设计、快速响应性能、简易安装、代码语法高亮、Markdown和LaTeX支持、本地RAG集成、Web浏览能力、提示预设支持、…

Vue 中使用事件总线来进行组件间通信($emit()、$on() 和 $off())

使用场景: 上一篇文章中写到的: echarts图表左击显示自定义弹框,右击取消自定义弹框 结构图:(removet修改为remove) 假设这个echarts图表是子组件B页面中。而父页面A的自定义弹框标签里调用了子组件B&am…