神经网络八股(1)

news2025/5/21 10:42:24

1.什么是有监督学习,无监督学习

有监督学习是带有标签的,无监督学习是没有标签的,简单来说就是有监督学习的输入输出都是固定的,已知的,无监督学习输入是已知的,输出是不固定的,无监督学习是通过数据发现规律和经验,进而产生输出的

2.卷积的作用

核心作用是通过与一个特定的核(或滤波器)进行运算。在不同领域中实现信号或数据的特征提取、滤波、增强等功能。它的核心优势在于能够通过简单的数学运算实现复杂的特征学习和变换,同时减少计算量和参数数量。

卷积的计算公式:

3.池化层的作用

池化层主要作用是降低数据的空间维度,提取重要的特征,并且提高模型的计算效率。池化层通常在卷积层之后使用,可以分为最大池化(Max Pooling)和平均池化(Average Pooling)两种类型。

降维,减少数据计算量,特征提取,提取图像主要信息,减轻过拟合,减少模型参数量

4.全连接层作用

特征整合卷积层和池化层提取的特征通常是局部的、分布式的,而全连接层通过大量的神经元之间的连接,将这些局部特征组合成更高级别的全局特征表示。

分类或回归:全连接层的最终输出通常用于分类或回归任务。在分类任务中,最后一个全连接层的输出神经元数量通常与类别数量相同。在回归任务中,最后一个全连接层通常只有一个输出神经元,用于预测连续的数值。

输出层特征映射:全连接层中的每个神经元都与前一层的所有神经元相连,这种密集的连接方式使得全连接层能够学习到非常复杂的特征组合和映射关系

隐藏层维度变化

5.什么是空洞卷积

空洞卷积(Dilated Convolution)是一种特殊的卷积操作,通过引入一个称为“扩张率”(dilation rate)的参数,在卷积核中插入间隔,从而扩大感受野,同时保持计算效率。当扩张率为1时,空洞卷积等同于普通卷积;当扩张率大于1时,卷积核会在采样点之间跳过一定数量的像素,从而覆盖更大的区域。空洞卷积可以任意扩大感受野,且不需要引入额外参数

6.1*1卷积的作用

1x1卷积,也称为点卷积,其卷积核大小为1。

通道数变换:可以将输入特征图的通道数从Cin变换为C_out,而不需要改变特征图的空间维度
线性组合:由于1x1卷积核只覆盖一个像素点,因此它实际上是在对每个像素点的通道值进行加权求和。这可以用于提取特征图中的有用信息,或者进行特征的线性变换。

7.训练策略

优化技术:

学习率调整(如余弦退火)或周期性学习率调整

优化器选择:Adam,SGD

批量大小调整:较大的批量可以提高计算效率,但可能导致过拟合;较小的批量可以提高泛化能力,但可能增加训练时间

梯度累积:梯度累积技术可以在小批量训练中模拟大批量的效果

泛化技术:

正则化:使用L1、L2正则化或Dropout可以有效防止模型过拟合

数据增强:对训练数据进行变换(如旋转、缩放、平移等)

早停机制:在验证集性能不再提升时提前停止训练,结合学习率衰减策略,可以避免过拟合

8.什么是过拟合和欠拟合,有什么方法解决

欠拟合是在训练集和测试集上误差都很高,网络没有学习到数据背后的规律和结构,没有学习到有用的特征,只是学习到了一些噪声和表面的东西。

过拟合就是训练集上表现得太好了,在测试集上反而表现得不好,原因就是在训练集上学习的只是一些简单的特征,从而削弱了该模型的泛化性导致在测试集上表现不好。

解决办法:欠拟合很明显就是训练不够彻底,可以选择增加模型的复杂度,增加训练集数据样本多样性,多用数据增强技术。过拟合就是训练的过头了,拟合的太好了,可以采用一些较为简单的模型,或者采用正则化,如dropout,减少特征维度。

9.有什么激活函数

神经网络非线性

sigmoid(二分类), relu ,tanh,leakyRelu, softmax(多分类)

leakrelu解决了ReLU的“死亡ReLU”问题,即使输入小于0,也有非零梯度

10.为什么Relu比Sigmod好

因为sigmod在梯度过大过小的时候存在梯度饱和问题,会发生梯度消失问题,而relu在大于0时候则不会发生梯度消失问题,稀疏性:当神经元输出小于0的时候经过relu的时候输出为0,会让神经元失活,类似dropout的效果。

本篇文章源自对知乎fp16占几个字节博主得学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2303231.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深度学习每周学习总结Y1(Yolov5 调用官方权重进行检测 )

🍨 本文为🔗365天深度学习训练营 中的学习记录博客Y1中的内容 🍖 原作者:K同学啊 | 接辅导、项目定制 ** 注意该训练营出现故意不退押金,恶意揣测偷懒用假的结果冒充真实打卡记录,在提出能够拿到视频录像…

计算机视觉基础|从 OpenCV 到频域分析

一、引言 在当今数字化时代,图像处理已渗透到我们生活的方方面面,从日常使用的智能手机拍照美化,到医学领域的精准诊断,再到自动驾驶中的环境感知,其重要性不言而喻。在图像处理领域中,OpenCV 和频域分析&…

74. 搜索二维矩阵(LeetCode 热题 100)

题目来源; 74. 搜索二维矩阵 - 力扣(LeetCode) 题目内容: 给你一个满足下述两条属性的 m x n 整数矩阵: 每行中的整数从左到右按非严格递增顺序排列。 每行的第一个整数大于前一行的最后一个整数。 给你一个整数 target &am…

netcore libreoffice word转pdf中文乱码

一、效果 解决: cd /usr/share/fonts/ mkdir zhFont cd zhFont #windows系统C:\Windows\Fonts 中复制/usr/share/fonts/zhFont sudo apt update sudo apt install xfonts-utils mkfontscale mkfontdir #刷新字体缓存 fc-cache -fv #查看已安装的字体列表 fc-list :…

qt-C++笔记之创建和初始化 `QGraphicsScene` 和 `QGraphicsView` 并关联视图和场景的方法

qt-C笔记之创建和初始化 QGraphicsScene 和 QGraphicsView 并关联视图和场景的方法 code review! 参考笔记 1.qt-C笔记之创建和初始化 QGraphicsScene 和 QGraphicsView 并关联视图和场景的方法 2.qt-C笔记之QGraphicsScene和 QGraphicsView中setScene、通过scene得到view、通过…

OpenGL 01--构建GLFW、创建第一个工程、配置GLAD

一、OpenGL介绍 一般它被认为是一个API(Application Programming Interface, 应用程序编程接口),包含了一系列可以操作图形、图像的函数。然而,OpenGL本身并不是一个API,它仅仅是一个由Khronos组织制定并维护的规范(Specification)。 OpenGL规…

【时时三省】(C语言基础)求多项式1-1/2+1/3-1/4+...+1/99-1/100的值 用C语言表示

山不在高,有仙则名。水不在深,有龙则灵。 ----CSDN 时时三省 示例: 输出结果是 0.688172

kafka-集群缩容

一. 简述: 当业务增加时,服务瓶颈,我们需要进行扩容。当业务量下降时,为成本考虑。自然也会涉及到缩容。假设集群有 15 台机器,预计缩到 10 台机器,那么需要做 5 次缩容操作,每次将一个节点下线…

Ubuntu22.04 - etcd的安装和使用

目录 介绍安装Etcd安装etcd的客户端使用 介绍 Etcd 是一个 golang 编写的分布式、高可用的一致性键值存储系统,用于配置共享和服务发现等。它使用 Raft 一致性算法来保持集群数据的一致性,且客户端通过长连接watch 功能,能够及时收到数据变化…

排查JVM的一些命令

查看JVM相关信息的方法 环境&#xff1a; Win10, jdk17 查看端口的Pid netstat -ano | findstr <端口号>列出当前运行的JVM进程 ## 用于输出JVM中运行的进程状态信息。通过jps&#xff0c;可以快速获取Java进程的PID&#xff08;进程标识符&#xff09;&#xff0c; …

Arduino 第十六章:pir红外人体传感器练习

Arduino 第十六章&#xff1a;PIR 传感器练习 一、引言 在 Arduino 的众多有趣项目中&#xff0c;传感器的应用是非常重要的一部分。今天我们要学习的主角是 PIR&#xff08;被动红外&#xff09;传感器。PIR 传感器能够检测人体发出的红外线&#xff0c;常用于安防系统、自动…

自动化之ansible(二)

一、ansible中playbook&#xff08;剧本&#xff09; 官方文档&#xff1a; Ansible playbooks — Ansible Community Documentation 1、playbook的基本结构 一个基本的playbook由以下几个主要部分组成 hosts: 定义要执行任务的主机组或主机。 become: 是否需要使用超级用户…

QSNCTF-WEB做题记录

第一题&#xff0c;文章管理系统 来自 <天狩CTF竞赛平台> 描述&#xff1a;这是我们的文章管理系统&#xff0c;快来看看有什么漏洞可以拿到FLAG吧&#xff1f;注意&#xff1a;可能有个假FLAG哦 1&#xff0c;首先观察题目网站的结构和特征 这个一个文件管理系统&#x…

Ruoyi-Vue 3.8.7集成积木报表JmReport和积木大屏JimuBI

Ruoyi-Vue 3.8.7集成积木报表JmReport和积木大屏JimuBI 一、版本 RuoYi-Vue版本&#xff1a;v3.8.7 JMreport报表版本&#xff1a; v1.9.4 JimuBI大屏版本&#xff1a;V1.9.4 二、数据库 积木数据库sql 下载后&#xff0c;使用数据库管理工具执行sql脚本&#xff0c;将需…

亲测可用,IDEA中使用满血版DeepSeek R1!支持深度思考!免费!免配置!

作者&#xff1a;程序员 Hollis 之前介绍过在IDEA中使用DeepSeek的方案&#xff0c;但是很多人表示还是用的不够爽&#xff0c;比如用CodeChat的方案&#xff0c;只支持V3版本&#xff0c;不支持带推理的R1。想要配置R1的话有特别的麻烦。 那么&#xff0c;今天&#xff0c;给…

jvm中各个参数的理解

MEMORY - MANAGERS 定义 MEMORY - MANAGERS即内存管理器&#xff0c;它是操作系统或软件系统中负责管理计算机内存资源的组件。从本质上来说&#xff0c;它是一种软件机制&#xff0c;旨在协调计算机系统中内存的分配、使用和回收等操作&#xff0c;确保系统能够高效、稳定地…

【队列】循环队列(Circular Queue)详解

文章目录 一、循环队列简介二、循环队列的判空和判满三、循环队列的实现leetcode 622. 设计循环队列 一、循环队列简介 在实际开发中&#xff0c;队列是一种常用的数据结构&#xff0c;而循环队列&#xff08;Circular Queue&#xff09;则一般是一种基于数组实现的队列&#x…

DeepSeek掀起推理服务器新风暴,AI应用迎来变革转折点?

AI 浪潮下&#xff0c;推理服务器崭露头角 在科技飞速发展的当下&#xff0c;AI 是耀眼明星&#xff0c;席卷各行业&#xff0c;深刻改变生活与工作模式&#xff0c;从语音助手到医疗诊断、金融风险预测&#xff0c;AI 无处不在。其发展分数据收集整理、模型训练、推理应用三个…

Vue 项目中逐步引入 TypeScript 的类型检查

在现有的 Vue 项目中逐步引入 TypeScript 的类型检查 本文源于一道面试题&#xff1a;注&#xff1a;两种问法一个意思哈&#xff01;&#xff01; 问题一&#xff1a;“ 老项目Js写的&#xff0c;如何轻量方式享受 ts 类型&#xff1f;” 问题二&#xff1a;“如何 在现有的 …

Git企业开发

Git&#xff08;版本控制器&#xff09; 在我们对于文档进行操作的时候&#xff0c;很多时候可能会出现多个文档&#xff0c;对这些文档进行多个版本的保存和记录就变成必要的。通俗的讲&#xff0c;就是记录每次的修改和记录版本迭代的管理系统。目前最主流的版本控制器就是G…