生命在于学习——Python人工智能原理(3.4)

news2025/6/27 10:03:59

在这里插入图片描述

三、深度学习

7、过拟合与欠拟合

过拟合和欠拟合是所有机器学习算法都要考虑的问题。

(1)基本定义

a、欠拟合

欠拟合是指机器学习模型无法完全捕获数据集中的复杂模式,导致模型在新数据上的表现不佳,这通常是由于模型过于简单或不够复杂,无法充分利用数据集中的特征进行训练。
欠拟合的原因可能有:

  1. 模型复杂度不足
  2. 特征选择不当
  3. 数据预处理不当
  4. 数据量不足
  5. 训练不足

b、过拟合

过拟合是机器学习中的一个常见问题,它发生在模型过于复杂,以至于在训练数据上表现的非常好,但在新的、未见过的数据上表现不佳时,过拟合的模型对训练数据中的细节和噪声非常敏感,并可能将这些细节和噪声作为一般规则来学习,导致在测试数据上的泛化能力下降。
过拟合的原因可能包括:
1.模型复杂度过高
2.训练数据不足
3.数据分布不均或存在噪声
4.训练时间过长

c、平衡

在机器学习中,平衡是指找到一个合适的模型复杂度,既能避免欠拟合,又能防止过拟合,从而实现模型在训练数据和测试数据上的良好表现。
为了平衡模型的性能,可以考虑以下几个方面:
1.选择合适的模型
2.调整模型复杂度
3.正则化
4.早停法
5.数据增强与选择
6.交叉验证
7.集成学习
8.监控性能指标

(2)处理方法

a、欠拟合解决办法

1.增加特征数量
2.增加模型复杂度
3.减少正则化参数
4.增加训练数据
5.改进特征工程
6.使用更复杂的算法
7.使用集成学习

b、过拟合解决办法

1.权值衰减
2.提前停止训练
3.正则化
4.减少模型参数
5.Dropout
6.数据增强
7.决策树剪枝
8.交叉验证

8、卷积神经网络

卷积神经网络是一类包含卷积计算且具有深度结果的前馈神经网络,是深度学习的代表算法之一。卷积神经网络具有表征学习能力,能够按照其阶层结构对输入信息进行平移不变分类,因此也被成为平移不变人工神经网络。
卷积神经网络仿照生物的视知觉机制创建,可以进行监督学习与非监督学习,其卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征,如像素和音频进行学习,效果较好且没有额外的特征工程要求。

(1)卷积神经网络的结构

主要分为输入层、卷积层、池化层、全连接层、分类层等。

a、输入层

输入层是整个神经网络的输入,在处理图像的卷积神经网络中,它一般代表了一张图片的像素矩阵。其中三维矩阵的长和宽代表了图像的大小,深度代表了图像的色彩通道,从输入层开始,卷积神经网络通过不同的神经网络架构将上一层的三维矩阵转换为下一层的三维矩阵,直到最后的全连接层。

b、卷积层

卷积层是一个网络最重要的部分,卷积层试图将神经网络中的每小块进行更加深入的分析从而获得抽象度更高的特征。

c、池化层

池化层神经网络不会改变三维矩阵的深度,但是它可以缩小矩阵的大小,通过池化层可以进一步缩小最后全连接层中节点的个数,从而达到减小整个神经网络参数的目的。

d、全连接层

在经过多轮卷积和池化之后,在卷积神经网络的最后一班有1-2个全连接层给出最后的分类结果,经过几轮卷积和池化之后,可以认定图像中的信息已经被抽象成信息含量更高的特征。

e、Softmax层

Softmac层主要用于分类问题,通过Softmax层可以得到当前输出属于不同种类的概率分布情况。该层主要采用Softmax函数,又称归一化指数函数,是对数概率回归在C个不同值上的推广,公式如下:
在这里插入图片描述

其中,C表示神经网络输出层的输出数量,i表示输出层第i个输出,oi表示第i个输出值,e表示自然常数,∑c j=1 e-oj表示所有神经元输出值的对数概率函数之和。
Python实现代码如下:
def softmax(x):
exp_x = np.exp(x)
return exp_x/np.sum(exp_x)

(2)卷积的相关计算

a、重要参数介绍

卷积核大小
卷积核一班宽和高都比较小,如果输入是图片,宽高一般相同。
卷积核数量
卷积核数量即卷积产生的通道数,不同卷积核在输入数据中寻找不相同的特征,一般卷积核数量大于输入通道数,并且随着卷积的进行卷积核数量越来越多。
步长
在滑动卷积核时,必须制定步长,步长为1,是指卷积核每次移动1个像素,步长为2,是指每次移动2个像素。
零填充
有时候将输入数据用0在边缘处进行填充是很方便的。零填充的尺寸是一个超参数,零填充有一个良好性质,即可以控制输出数据的空间尺寸。

b、参数量及特征图计算

假设输入数据维度为WxHxCin,卷积核尺寸KxK,步长S,卷积核数量Cout,零填充数量为P,则特征图的宽W2,高H2,深D2,计算公式分别为:
W2=H2=(W-K+2P)/S+1
D2=Cout

c、池化层计算

池化层可以有效缩小矩阵尺寸,从而减小全连接层的参数数量,加快计算速度的同事有效防止过拟合问题。
最常用的池化方式是最大池化和平均池化,池化操作只减小矩阵的宽和高,不减少矩阵的深度。

d、全连接层计算

全连接层不保存分类信息,在整个卷积神经网络中起到分类器的作用。
下面为全连接层的计算过程,设x1,x2,x3为全连接层的输入,a1,a2,a3为输出,则有:
在这里插入图片描述

假设全连接层的输入维度是800,输出维度是500,则:
1、Loss对全连接的输入求导,如下:
在这里插入图片描述

2、Loss对权重系数求导:
在这里插入图片描述

3、对偏置系数b求导:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1822624.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

能在电脑桌面记笔记的软件是什么 电脑笔记软件

在这个数字化高速发展的时代,电脑已成为我们日常工作和学习的必备工具。而对我来说,电脑桌面不仅仅是一个简单的工作界面,更是一个思考和创造的平台。我时常需要在工作时快速记录一些重要信息或灵感,这时候,能在电脑桌…

机器学习与数据挖掘知识点总结(二)分类算法

目录 1、什么是数据挖掘 2、为什么要有数据挖掘 3、数据挖掘用在分类任务中的算法 朴素贝叶斯算法 svm支持向量机算法 PCA主成分分析算法 k-means算法 决策树 1、什么是数据挖掘 数据挖掘是从大量数据中发现隐藏在其中的模式、关系和规律的过程。它利用统计学、机器学…

我的考研经历

当我写下这篇文章时,我已经从考研 的失败中走出来了,考研的整个过程都写在博客日志里面了,在整理并阅读考研的日志时,想写下一篇总结,也算是为了更好的吸取教训。 前期日志模板:时间安排的还算紧凑&#x…

视频美颜工具技术探秘:直播美颜SDK的应用与发展

今天,笔者将深入探讨直播美颜SDK的应用场景和发展趋势,揭示其背后的技术奥秘和潜力。 一、直播美颜SDK的基本原理 直播美颜SDK其基本原理包括以下几个方面: 人脸检测与特征定位 肤色分析与调整 瑕疵修复与细节增强 滤镜和特效应用 二、…

在ubuntu中恢复误删除的文件

1、安装 TestDisk 在 Ubuntu 上,可以使用以下命令安装 TestDisk: sudo apt-get install testdisk2、查询你删除的文件所在那个分区 #查询分区 df -h #我这里是/dev/sda2 #也可以使用下面命令查看具体哪个分区 lsblk3、查询该分区是什么系统类型 sudo …

微软bing英文地图公司地址标注

实现效果如下&#xff1a; 通过微软Bing地图嵌入代码&#xff0c;以在网站中展示公司地址&#xff0c;使用鼠标滚动可缩放或点击拖动地图。 直接上代码&#xff0c;根据自己的需求修改相关信息即可。 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN…

语法08 C++ 数据类型之间的强制转换

强制类型转换 强制类型转换&#xff0c;就是把一种数据类型转化为另一种指定的数据类型。 它是一种临时的转换。 强制类型转换格式 格式&#xff1a;(数据类型) (表达式) 即&#xff1a;(要被转换成的类型&#xff09;&#xff08;被转换的式子&#xff09;; 注意&#x…

SCT82A32 是一款 100V 电压模式控制同步降压控制器

主要特征 ◦ 5.5V-100V 宽输入范围 ◦ 0.8V-60V 可调输出电压 ◦ 0.8V1% 参考电压 ◦ 最低占空比下的40ns 最小 tON ◦ 最高占空比下的150ns 最小 tOFF • 100 KHz 到 1.2 MHz 开关频率 ◦ 时钟同步输入/输出功能 ◦ 可选择二极管仿真或 FPWM • 7.5V 门极驱动器 ◦ 2.3A …

Kettle作业优化指南:在 TASKCTL 统一任务调度平台的实践技巧

ETL世界里的调度难题&#xff0c;是否让你夜不能寐&#xff1f;Kettle 作为开源ETL工具的佼佼者&#xff0c;虽然功能强大&#xff0c;但其调度监控的短板却让无数从业者头疼不已。今天&#xff0c;我要带你走进一个全新的调度世界——自动化任务编排工具 TASKCTL 它不仅解决了…

如何用Vue3和p5.js打造一个令人惊叹的3D球体在线展示

本文由ScriptEcho平台提供技术支持 项目地址&#xff1a;传送门 使用 p5.js 创建交互式 3D 图形 应用场景介绍 p5.js 是一个用于创建交互式图形和动画的 JavaScript 库。它被广泛用于教育、艺术和设计领域&#xff0c;让开发者可以轻松创建具有吸引力的可视化效果。 代码基…

怎么改变图片分辨率dpi数值?图片改分辨率的在线技巧

在上传图片的时候除了图片大小、尺寸等要求之外&#xff0c;修改图片分辨率也是比较常见的一个问题&#xff0c;需要将图片按照平台的要求修改完成后才可以正常使用。当遇到图片dpi的数值不满足使用需求的时候&#xff0c;有什么方法能够更加快捷的修改图片dpi呢&#xff1f;今…

如何通过SOLIDWORKS教育版提高学生技能培养未来人才?

在当今这个科技日新月异的时代&#xff0c;掌握先进的数字化工具已经成为了一项需备的技能。作为一款功能强大的3D CAD软件&#xff0c;SOLIDWORKS教育版正是一个帮助学生提升技能、培养未来人才的重要工具。那么&#xff0c;如何通过SOLIDWORKS教育版提高学生技能呢&#xff1…

VirtualBox配置双网卡实现宿主机和虚拟机相互访问以及虚拟机外网访问

目录 一&#xff1a;背景 二&#xff1a;实现 三&#xff1a;总结 一&#xff1a;背景 在VirtualBox中配置虚拟机以实现本地主机远程登录、访问外网以及虚拟机之间的相互访问&#xff0c;是一种常见的虚拟化实践&#xff0c;适用于多种场景&#xff0c;如开发、测试和远程工…

鸿蒙 游戏来了 鸿蒙版 五子棋来了 我不允许你不会

团队介绍 作者:徐庆 团队:坚果派 公众号:“大前端之旅” 润开鸿生态技术专家,华为HDE,CSDN博客专家,CSDN超级个体,CSDN特邀嘉宾,InfoQ签约作者,OpenHarmony布道师,电子发烧友专家博客,51CTO博客专家,擅长HarmonyOS/OpenHarmony应用开发、熟悉服务卡片开发。欢迎合…

打造信任和忠诚:增加和改善客户评价的10种方法

客户推荐和产品评价可以成为您最强大的销售工具之一。超过70%的消费者表示他们在购买前会查看产品评价&#xff0c;近63%的消费者表示他们更有可能从有产品评级和评价的网站购买。社会认可可以安抚犹豫的购物者&#xff0c;提供额外的背景信息&#xff0c;并通过确保买家对购买…

【网络编程】基于UDP的服务器端/客户端

UDP可看作是信件邮寄&#xff0c;邮寄过程可能会信件丢失&#xff0c;是一种不可靠的数据传输服务。 但UDP性能更高&#xff0c;实现更加简洁。流控制是区分UDP和TCP的最重要标志。 IP的作用就是让离开主机B的UDP数据包传递给主机B&#xff0c;UDP根据端口号将传到主机的数据包…

6.14工作总结

今天上午&#xff0c;我把之前睿哥吩咐我的任务忙完之后&#xff0c;他就叫我看一下代码。 他跟我说公司的项目用的是微服务的。其实我不懂微服务是个啥&#xff0c;就只知道这个名字。 然后&#xff0c;我把设备管理系统的后端代码展示给他看&#xff0c;他给我指了指&#…

C4D如何预览动画?C4D动画云渲染助力

C4D是一款功能丰富的3D设计软件&#xff0c;以其快速的预览渲染和多样的渲染插件而闻名&#xff0c;其卓越的渲染效果赢得了CG行业专业人士的广泛赞誉。尽管C4D的渲染功能十分强大&#xff0c;但对于初学者而言&#xff0c;其复杂的渲染设置可能会带来一些挑战。本文一起来看看…

Rollup 打包一个 JavaScript 项目

export default {input: "./src/FFCesium/core/index.js", // 输入文件output: {file: "public/lastVersion/FFCesium.confuse.js", // 输出文件//format: "cjs", // 打包格式为cjsformat: "es",exports: "default", // 或者…

计算机网络学习3

文章目录 以太网的MAC帧格式虚拟局域网VLAN概述虚拟局域网VLAN的实现机制以太网的发展802.11无线局域网的组成无线局域网的物理层无线局域网的数据链路层---使用CSMA/CD协议802.11无线局域网的MAC帧 网络层网络层概述网际协议IP和4.2.1异构网络互联IPv4地址及其编址方法概述IPv…