[神经网络]基干网络之VGG、ShuffleNet

news2026/2/18 7:27:04

一、VGG

VGG是传统神经网络堆叠能达到的极限深度。

VGG分为VGG16和VGG19，其均有以下特点：

①按2x2的Pooling层，网络可以分成若干段

②每段之内由若干same卷积操作构成，段内Feature Map数量固定不变；

③Feature Map按2的倍数递增（64-128-256-512），第四段后均为512

由于这种特性，可以根据任务灵活调整段数，段每增加一段，Feature Map尺寸减小一半

①网络结构

两个模型均分为5个Block，每个Blcok以下采样连接；每个Block均使用3x3卷积核；随着模块边深，Channel数会翻倍。

其均具备以下性质：

①输入尺寸均为224x224；

②均有5层Max Pooling，最终都会产生7x7的Feature Map；

③特征层会经过两个4096的全连接，最后再连接一个1000类的softmax分类器；

④其模型均可表述为mx(nx(conv33)+max_pooling)

一般会将VGG的卷积核更换为3x3或1x1的小尺寸卷积核来提升性能。（同感受野的情况下，小尺寸卷积核有更深的深度；感受野公式—rf size=(out-1)x stride+ksize）

VGG网络的卷积核个数：

VGG-16：2,2,3,3,3

VGG-19：2,2,4,4,4

随着网络层数的增加，像素维度的长宽降低，语义层面的通道上升。

②VGG16

特征图尺寸变化如下

资源消耗： 内存占用大部分由前两个卷积层贡献

参数量大部分由第一个全连接层贡献

VGG精度一般，且参数量较大

相较于AlexNet，VGG使用3x3卷积核（1步长），丢失信息量较少，且不使用归一化。

③3x3卷积核

2层叠加的3x3卷积核等价于一个5x5卷积核；3层叠加的3x3卷积核等价于一个7x7卷积核

虽然其感受野尺寸相同，但是更深的网络可以带来：更强的非线性、更好的表示能力；更少的参数个数。

二、ShuffleNet V1

①Group Pointwise Convolution（分组1x1卷积）

每个卷积核仅处理一部分通道（传统卷积一个卷积核处理全部通道），可以有效减少参数数量。

②Channel Shuffle（通道重排）

目的是引入跨组的信息交融

Channel Shuffle操作：

①将通道重组为一个n列矩阵

②将矩阵转置

③重新将其展平(Flatten)

Channel shuffle可以直接使用pytorch的api实现，且可微分、可导（能实现端到端的训练）；同时不会引入额外的计算量

③网络结构

Shuffle Block改进自ResNet的Bottleneck Block：

1.将1x1的降维和升维均改为组卷积

2.降维后引入channel Shuffle；

3.将3x3的标准卷积替换为Depthwise卷积。

下图所示为标准Shuffle Block（左侧为标准模块，右侧为下采样模块<Stride=2>）

分组卷积组数不同，可用的卷积核个数不同（组数与可用卷积核数成正比）

Concat操作：将计算得到的特征图进行堆叠而不是诸元素相加

网络构造：通常来说g=3是常用的ShuffleNet V1

超参数g可以用来控制分组组数；分组组数越高，正确率越高

三、ShuffleNet V2

①网络轻量化的准则

1.输入输出通道相同时，内存占用量（MAC）最小（对1x1卷积而言）

2.分组数过大的分组卷积会增大MAC

3.碎片化操作对并行加速不友好

4.逐元素操作带来的内存和耗时不可忽略

②ShuffleNet V2模块

下图所示为基本模块(左图)；下采样模块(右图)

改进如下：

①Channel Split操作：将输入通道一分为二，分别分给残差连接和卷积网络

②Concat操作：将计算得到的特征图进行堆叠而不是诸元素相加

③1x1卷积不带分组卷积

Channel Shuffle和Channel Split在代码中是一个操作

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/367872.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

对个人博客系统进行web自动化测试（包含测试代码和测试的详细过程）

对个人博客系统进行web自动化测试（包含测试代码和测试的详细过程）

目录一、总述二、登录页面测试一些准备工作验证页面显示是否正确验证正常登录的情况该过程中出现的问题验证登录失败的情况关于登录界面的总代码测试视频三、注册界面的自动化测试测试代码过程中出现的bug 测试视频四、博客列表页测试（…

阅读更多...

【Leedcode】数据结构中链表必备的面试题（第四期）

【Leedcode】数据结构中链表必备的面试题（第四期）

【Leedcode】数据结构中链表必备的面试题（第四期） 文章目录【Leedcode】数据结构中链表必备的面试题（第四期）1.题目2.思路图解(1)思路一(2)思路二3.源代码总结1.题目相交链表： 如下（示例）&…

阅读更多...

小白福利!我开发了一个快速部署库

小白福利!我开发了一个快速部署库

1、开发背景很多入门的同学，在跟着视频敲完代码之后，在打包出来的产物犯了难如果是 hash 路由，要么使用后端部署，要么使用 github 或者 gitee 提供的静态部署服务如果是 history 路由，那只能使用后端框架进行部署&a…

阅读更多...

内网渗透(五十三)之域控安全和跨域攻击-利用域信任密钥获取目标域控

内网渗透(五十三)之域控安全和跨域攻击-利用域信任密钥获取目标域控

系列文章第一章节之基础知识篇内网渗透(一)之基础知识-内网渗透介绍和概述内网渗透(二)之基础知识-工作组介绍内网渗透(三)之基础知识-域环境的介绍和优点内网渗透(四)之基础知识-搭建域环境内网渗透(五)之基础知识-Active Directory活动目录介绍和使用内网渗透(六)之基…

阅读更多...

前端学习日记——Vue之Vuex初识（一）

前端学习日记——Vue之Vuex初识（一）

前言学习前端一段时间了，因为一直是做Python开发，所以凭借着语言的通性学习Javascript、Vue轻快很多，但一些碎片化的知识及插件的使用方法还是需要记录一下，时而复习，形成系统化的知识体系（PS：…

阅读更多...

【Linux线程池】

【Linux线程池】

Linux线程池Linux线程池线程池的概念线程池的优点线程池的应用场景线程池的实现Linux线程池线程池的概念线程池是一种线程使用模式。线程过多会带来调度开销，进而影响缓存局部和整体性能，而线程池维护着多个线程，等待着监督管理者分配可并…

阅读更多...

JavaScript if…else 语句

JavaScript if…else 语句

条件语句用于基于不同的条件来执行不同的动作。条件语句通常在写代码时，您总是需要为不同的决定来执行不同的动作。您可以在代码中使用条件语句来完成该任务。在 JavaScript 中，我们可使用以下条件语句：if 语句 - 只有当指定条件为 true 时&a…

阅读更多...

【企业云端全栈开发实践-3】Spring Boot文件上传服务+拦截器

【企业云端全栈开发实践-3】Spring Boot文件上传服务+拦截器

本节目录一、静态资源访问二、文件上传原理三、拦截器3.1 拦截器定义代码3.2 拦截器注册一、静态资源访问使用IDEA创建Spring Boot项目时，会默认创建classpath://static/目录，静态资源一般放在这个目录下即可。如果默认的静态资源过滤策略不能满足开…

阅读更多...

做独立开发者，能在AppStore赚到多少钱？

做独立开发者，能在AppStore赚到多少钱？

成为一名独立开发者，不用朝九晚五的上班，开发自己感兴趣的产品，在AppStore里赚美金，这可能是很多程序员的梦想，今天就来盘一盘，这个梦想实现的概率有多少。先来了解一些数据： 2022年5月26日&am…

阅读更多...

目标跟踪系列总结

目标跟踪系列总结

目标跟踪算法： sort算法: sort算法流程图关联成功的检测box与追踪box处理：使用检测的box对追踪结果进行KalmanFilter权重以及参数更新，同时记录关联追踪box的计数次数； 未关联成功的box处理：对检测的box进行KalmanF…

阅读更多...

C++【内存管理】

C++【内存管理】

文章目录C内存管理一、C/C内存分布1.1.C/C内存区域划分图解：1.2.根据代码进行内存区域分析二、C内存管理方式2.1.new/delete操作内置类型2.2.new和delete操作自定义类型三、operator new与operator delete函数四、new和delete的实现原理4.1.内置类型4.2.自定义类型4…

阅读更多...

如何利用有限的数据发表更多的SCI论文？——利用ArcGIS探究环境和生态因子对水体、土壤和大气污染物的影响

如何利用有限的数据发表更多的SCI论文？——利用ArcGIS探究环境和生态因子对水体、土壤和大气污染物的影响

SCI的写作和发表是科研人提升自身实力和实现自己价值的必要途径。“如何利用有限的数据发表更多的SCI论文？”是我们需要解决的关键问题。软件应用只是过程和手段，理解事件之间的内在逻辑和寻找事物之间的内在规律才是目的。如何利用有限的数据发表更多的…

阅读更多...

互联网企业如何进行数字化转型？业务需求迭代频繁的应对之策！

互联网企业如何进行数字化转型？业务需求迭代频繁的应对之策！

互联网行业作为我国数字经济发展“四化”框架中生产力主要组成部分，是国家数字化转型的主要推动者之一。为此，相对于其他传统行业来说，互联网行业企业数字化转型的紧迫程度更高，如果不数字化转型或者转型不成功，会有更…

阅读更多...

ArcGIS制作地形分析

ArcGIS制作地形分析

ArcGIS制作地形分析的方法解析树谷资料库资源大全（2月9日更新） 在地形变化较大的建筑、景观、城市设计项目中，高程、坡度、坡向分析是非常重要的，而在这几类分析中，ArcGIS软件可以比较方便的完成相关分析的制作。今…

阅读更多...

OAuth2.0入门

OAuth2.0入门

什么是OAuth2.0 OAuth（Open Authorization）是一个关于授权（authorization）的开放网络标准，允许用户授权第三方应用访问他们存储在另外的服务提供者上的信息，而不需要将用户名和密码提供给第三方移动应用或…

阅读更多...

HTML基础（3）

HTML基础（3）

HTML基础单选框、复选框、下拉框文本框< script >标签属性< script >基本使用单选框、复选框、下拉框文本框 < script >标签属性 type属性定义script元素包含或src引用的脚本语言。属性值是MIME类型，包括text/javascript,text/ecmascript, appl…

阅读更多...

SpringBoot2零基础到项目实战-基础篇

SpringBoot2零基础到项目实战-基础篇

SSM内容01-SpringBoot工程入门案例开发步骤SpringBoot 是 Pivotal 团队提供的全新框架，设计目的是简化 Spring 应用的初始搭建以及开发过程。使用了 Spring 框架后已经简化了我们的开发。而 SpringBoot 又是对 Spring 开发进行简化的，可想而知 SpringBoo…

阅读更多...

使用DQN进行价格管理

使用DQN进行价格管理

文章目录前言一、不同的价格响应二、利用DQN优化定价策略1.定义环境2.DQN算法概述3.Algorithm: Deep Q Network (DQN)总结强化学习-定价、决策前言供应链和价格管理是企业运营中最早采用数据科学和组合优化方法的领域，并且在使用这些技术方面有着悠久的历史&#…

阅读更多...

RabbitMQ 实现延迟队列

RabbitMQ 实现延迟队列

业务场景：1.生成订单30分钟未支付，则自动取消，我们该怎么实现呢？2.生成订单60秒后,给用户发短信1 安装rabbitMqwindows安装ubuntu中安装2 添加maven依赖<!-- https://mvnrepository.com/artifact/org.springframework.boot/spr…

阅读更多...

内网渗透(五十四)之域控安全和跨域攻击-利用krbtgt哈希值获取目标域控

内网渗透(五十四)之域控安全和跨域攻击-利用krbtgt哈希值获取目标域控

系列文章第一章节之基础知识篇内网渗透(一)之基础知识-内网渗透介绍和概述内网渗透(二)之基础知识-工作组介绍内网渗透(三)之基础知识-域环境的介绍和优点内网渗透(四)之基础知识-搭建域环境内网渗透(五)之基础知识-Active Directory活动目录介绍和使用内网渗透(六)之基…

阅读更多...

推荐文章

最新文章