【DropBlock】《DropBlock:A regularization method for convolutional networks》

news2025/7/14 10:40:26

在这里插入图片描述

NIPS-2018


文章目录

  • 1 Background and Motivation
  • 2 Related Work
  • 3 Advantages / Contributions
  • 4 DropBlock
  • 5 Experiments
    • 5.1 ImageNet Classification
      • 5.1.1 DropBlock in ResNet-50
      • 5.1.2 DropBlock in AmoebaNet
    • 5.2 Experimental Analysis
    • 5.3 Object Detection in COCO
    • 5.4 Semantic Segmentation in PASCAL VOC
  • 6 Conclusion(own)


1 Background and Motivation

Dropout 的缺点,as a regularization technique for fully connected layers, it is often less effective for convolutional layers

有此缺点的原因,activation units in convolutional layers are spatially correlated so information can still flow through convolutional networks despite dropout.

Thus a structured form of dropout is needed to regularize convolutional networks

作者提出了 DropBlock,a form of structured dropout, where units in a contiguous region of a feature map are dropped together

在这里插入图片描述
the networks must look elsewhere for evidence to fit the data

2 Related Work

  • DropConnect
  • maxout
  • StochasticDepth
  • DropPath
  • Scheduled-DropPath
  • shake-shake regularization
  • ShakeDrop regularization

The basic principle behind these methods is to inject noise into neural networks so that they do not overfit the training data.

Our method is inspired by Cutout(灵感来源去 cutout,可参考 【Cutout】《Improved Regularization of Convolutional Neural Networks with Cutout》)

DropBlock generalizes Cutout by applying Cutout at every feature map in a convolutional networks.

3 Advantages / Contributions

提出DropBlock 数据增广策略,works better than dropout in regularizing convolutional networks

4 DropBlock

linearly increase it over time during training

Its main difference from dropout is that it drops
contiguous regions from a feature map of a layer instead of dropping out independent random units.

算法流程
在这里插入图片描述
示意图
在这里插入图片描述
先找 mask M M M,图2a 绿色区域, M M M 中找 block 中心点,也即 zero entry M i , j M_{i,j} Mi,j(红X),服从 M i , j ∼ B e r n o u l l i ( γ ) M_{i,j} \sim Bernoulli(\gamma) Mi,jBernoulli(γ),以 block 中心外扩形成边长为 block_size 的正方形 block 区域(黑X),黑X 和绿框重叠的区域被置为了0

两个要配置的参数

  • block_size,所有特征图上 block_size 大小固定
    DropBlock resembles dropout when block_size = 1 and resembles SpatialDropout when block_size covers the full feature map.(通道被 mask 了)
  • γ \gamma γ
    在这里插入图片描述
    其中 keep_prob 的含义, keep every activation unit with the probability of keep_prob,实验中被设置为了 between 0.75 and 0.95

Scheduled DropBlock

gradually decreasing keep_prob over time from 1 to the target value is more robust

实验中用的是线性 decrease(use a linear scheme of decreasing the value of keep_prob)

5 Experiments

Datasets

  • ILSVRC 2012 classification dataset
  • COCO
  • PASCAL VOC

5.1 ImageNet Classification

5.1.1 DropBlock in ResNet-50

在这里插入图片描述
1)Where to apply DropBlock

only after convolution layers or applying DropBlock after both convolution layers and skip connections.

applying DropBlock to Group 4 or to both Groups 3 and 4(对应的应该是 ResNet 的 stage4 和 stage5)

2)DropBlock vs. dropout
在这里插入图片描述

block_size 默认为 7

图 3a 可以看出,DropBlock 效果比较好

图 3b 可以看出,引入 scheduled keep_prob 后,acc 更高,而且应对不同的 keep_prob 设定,其鲁棒性更好(峰值维持的更持久)

在这里插入图片描述
图 4 可以看出,DropBlock 作用在 Group3&4 比单独作用在 Group3 上效果要好,引入 schedule keep_prob 后效果提升,DropBlock 作用在 skip connection 分支后,效果进一步提升。block_size 设置为7效果最好。

作者 diss SpatialDropout,can be too harsh when applying to
high resolution feature map on group 3,也是,整块特征图都丢

对比 Cutout,it does not improve the accuracy on the ImageNet dataset in our experiments.

5.1.2 DropBlock in AmoebaNet

在这里插入图片描述

5.2 Experimental Analysis

1)DropBlock drops more semantic information
在这里插入图片描述
validation accuracy reduced quickly with decreasing keep_prob during inference.

说明 DropBlock removes semantic information and makes classification more difficult.

2)Model trained with DropBlock is more robust

图5看出 block_size = 7 is more robust and has the benefit of block_size = 1 but not vice versa.

3)DropBlock learns spatially distributed representations
在这里插入图片描述
实话说第三列我没有怎么看出来是个书店

5.3 Object Detection in COCO

在这里插入图片描述

5.4 Semantic Segmentation in PASCAL VOC

在这里插入图片描述

6 Conclusion(own)

  • dropblock 和 dropout 是兼容的
  • 作用在 skip connection 可以进一步提升性能

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/8601.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue3新特性 Ⅱ

setup()中使用生命周期函数 在生命周期钩子前加上on来访问 并且需要保持小驼峰的命名方式,setup中的生命周期函数不包括beforeCreate和created。 onMounted:比以前的mounted有优势,以前生命周期函数只能存在一个&#…

发布新闻稿必须了解的几个问题

随着移动互联网的到来,有些企业把营销重心转移到了抖音小红书等新媒体,而传统的媒体营销被一些企业抛在脑后,其实小马识途认为媒体营销是信息源,其实是不可以放弃的,至少要有一定量的布局。 简单来说,新闻媒…

需要多久才能看完linux内核源码?

代码中自由颜如玉! 代码中自有黄金屋! 那么Linux内核代码到底有多少行? 我们需要多久能读完呢? 一、内核行数 Linux内核分为CPU调度、内存管理、网络和存储四大子系统,针对硬件的驱动成百上千。代码的数量更是大的…

kafka详解及集群环境搭建

一、kafka详解 安装包下载地址:https://download.csdn.net/download/weixin_45894220/87020758 1.1Kafka是什么? 1、Kafka是一个开源消息系统,由Scala写成。是由Apache软件基金会开发的一个开源消息系统项目,该项目的目标是为处…

Servlet

1.Servlet是什么 Servlet是java语言编写的运行在服务器端的程序Servlet是javaEE规范之一,规范就是接口Servlet是JavaWeb三大组件之一,三大组件分别是:Servlet,Filter,Listener2.Servlet干什么 Servlet接受客户端发来…

G - Damaged Bicycle 状压+最短路,D-七圣召唤_概率dp

G - Damaged Bicycle 状压最短路 最短路处理出1号节点和带车子的点到n的距离dist[x][n],G可以从节点1直接走到n,也可以从节点1走到带车子的节点再骑到n,如果车子坏了可以走到n,也可以走到下一个车子节点再进行之前的步骤,所以可以…

React源码解读之React Fiber

开始之前,先讲一下该文章能帮你解决哪些问题? facebook为什么要使用重构ReactReact Fiber是什么React Fiber的核心算法 - react是如何中断重启任务的react fiber部分源码简化版 前言 该文章涉及的源码部分基于React v17.0.2 why React Fiber 浏览器…

Go 语言搭建个人博客(qiucode.cn 重构篇 二)

1、MVC模式 MVC模式是一种 WEB 长期累积的总结,但这并不是唯一模式。 对于 MVC 模式,想必有过搭建 WEB 项目的开发者并无陌生。 服务器端负责将客户端发送过来的 HTTP 请求,进行处理(处理器),解析路由(Route),而后把 URL 映射到对应的控制器(Controller)。 MVC …

智慧公路解决方案-最新全套文件

智慧公路解决方案-最新全套文件一、建设背景二、思路架构三、建设方案1、智慧路产管理2、智慧基础设施3、智慧信息服务4、智慧交通管控5、智慧系统平台6、智慧辅助决策四、获取 - 智慧公路全套最新解决方案合集一、建设背景 交通出行主要面临的痛点是安全和拥堵,而…

算法与数据结构 - 散列表

文章目录引言一、散列表概述1.1 哈希函数1.2 散列表二、算法实战2.1 两数之和题目题解1. 暴力破解2. hash表结语点赞再看,养成习惯引言 某日,韩梅梅和李雷来到一家新开的网红图书馆借阅书籍。 韩梅梅: 李雷,快来帮我找下《数据结构从入门到放弃》 李雷看…

测试项目(MSTest)中涉及到读取App.config 操作(.net6)

文章目录环境问题排查过程查看Nuget包是否正确查看配置文件是否正确解决办法(手动)解决办法(自动)为什么是这样的呢?环境 VS2022MSTest项目.Net6版本 问题 在测试过程中发现读取App.config中的连接字符串是null&…

颜色杂项笔记

面向用户的HSV颜色模型的三个属性 面向用户的颜色模型HSV,有如下几个属性 Hue(色度、色调、色相):描述具体颜色,比如红、蓝、黄、绿等,可以理解为color的专业说法。 Saturation(饱和度&#xff…

红帽8使用nfs共享本地镜像

实验环境 FFF-server 192.168.80.100 SSS-client 192.168.80.254 实验前提关闭selinux和防火墙 第一步在开始之前我们可以先看一下nfs-server本地上的一个镜像挂载情况。如图1. 可以看到本地镜像已经被挂载上去。 第二步我们继续看一下server的yum仓库是否已经成功配置。如…

公布一小时下载量达10W:京东T5级架构师出品高并发核心编程手册

高并发有多重要? 高并发面试已经成了各大厂面试必问的题目,尤其是阿里、京东这样的大厂,面试的时候会往深了去问,可以说是你能回答出多少,你拿到大厂offer的概率就有多大! 因高并发的问题回答不上来的案例…

采购软件能否降低企业采购成本?如何实现的?

在如今的疫情影响下,降低成本一直是企业决策者的主要目标之一,在采购领域尤其如此。而很多企业在销售业绩下滑时,纷纷通过采购软件来降低采购成本从而提升利润,达到了不可思议的效果。那么采购软件能否降低企业采购成本&#xff1…

ELK日志实时分析

项目实训报告:ELK日志实时分析 任务目标 使用filebeat采集日志数据,通过kafka将数据传输给logstash进行过滤,最后输出到Elasticsearch绘制数据图表。 数据说明 实施步骤 将数据上传到家目录(/home/hadoop)&#…

CentOS7.5虚拟机扩展xfs文件系统

1.目标 虚拟机xfs文件系统挂载点根目录(也就是/dev/sda3)扩展空间 2.软件版本 Vmware WorkStation 16pro CentOS7.5 3.外部硬盘增加空间 硬盘空间只能增大,不能缩小,最大磁盘大小必须大于现在的size,否则扩展按钮置灰…

JSON 学习(FastJson和Jackson)

JSON 学习 文章目录JSON 学习1. Json数据格式1.1 Json 数据格式1.2 Json 对象格式1.3 数组对象相互嵌套格式1.3.1 数组中的元素是对象1.3.2 对象中的值是数组1.3.3 你中有我,我中有你2. 使用场景3. java里面操作json有哪些技术4. Fastjson4.1 FastJson的优点4.2 Fas…

Spring Security认证之基本认证

本文内容来自王松老师的《深入浅出Spring Security》,自己在学习的时候为了加深理解顺手抄录的,有时候还会写一些自己的想法。 快速入门 在Spring Boot项目中使用Spring Security非常方便,创建一个新的Spring Boot项目我们只要引入Web和Spri…

java项目:前后端分离SpringBoot+Vue+Element的校内跑腿平台

收藏点赞不迷路 关注作者有好处 项目编号:BS-XX-155 一,项目简介 近年来,随着国内都市化的发展,生产生活节奏变快、各种往来频繁。经济的高速发展催生出“懒人经济”。不想走出家门,饭菜可以送上门;不方便交水、电、…