U2net论文复现-简单解读-以及奇奇怪怪的改进-测试roc以及pr

news2025/7/10 7:49:14

论文地址:U2net论文地址

显著性目标检测:

Salient ObjectDetetion(SOD)显著性目标检测,就是要把图片中最显著的物体分割出来,所以是二分类任务,只需要背景和前景。

1、Introduce

1.1、目前存在的2个挑战:

1、全卷积网络(FCN)在图像分割中的兴起,显著行目标检测进一步发展,但是许多显著性目标检测都是基于VGG、ResNet等分类网络的。这些模型的预训练网络是基于Image数据集的,与显著性目标的数据分布存在差异,所以这些网络适合分类,不一定适合图像分割。

2、为了计算机能负担得起这些模型,所以随着网络层数的增加,特征图的大小要变小,但是特征图的分辨率对分割是有影响的。

1.2、U2net提出的方案

1. U2net从头开始训练。

1. 加入新的模块获得高分辨率,不会明显增加内存和计算成本。

2、Related works

这一部分列举了一大堆模型,说明深层特征的重要性,特征图分辨率的影响,多尺度特征提取的好处等。

各种卷积块的图片,最后e是U2net的RSU

3、提出的方法

3.1、论文总体架构:

3.2、RSU模块:

每一个RSU其实相当于一个小型的Unet网络,左边第一个绿色是对输入进行卷积,剩下的就是一个unet,只不过这个unet的层数在不同的RSU中不同。

3.3、自己绘制的总体网络图:

解码模块那边的RSU的结果输出后,要经过一个卷积调整通道数,因为要计算损失,所以有来了一个Upsample_like,将他调整和label图片一样大小。d0到d6分别计算交叉熵损失,然后加起来。

4、评估

4.1、论文的评估:

这是论文给出的评估,在大多数指标上,都超过了现有模型。模型大小为176.3MB,轻量版的为4.7MB。

论文里面给出的PR曲线,在DUTS-TE数据集上进行测试

4.2、自己尝试绘制的PR曲线

只使用了30张图片绘制,顺道把ROC曲线也画了一遍。

5、论文总结以及自己对模块的一点点改进

5.1、论文原话:

尽管我们的模型与其他最先进的方法相比取得了优越的结果,但在不久的将来,计算和内存有限的设备(例如手机、机器人等)需要更快和更小的模型,我们将探索不同的技术和架构以进一步提高速度并降低模型大小。此外,需要更大的多样化显着对象数据集来训练更准确和更稳健的模型。

5.2、尝试改进:

尝试将模型改的更小一点,更快一点。U2net网络中RSU模块里面有很多卷积,它们输入通道数和输出通道数相同,如果将这些卷积改进一下,降低一下模型参数,应该也是可行的。

方法:当RSU中使用输入通道数和输出通道数相同的卷积时,只将用一半通道数据进行运算。源代码中的模块叫做REBNCONV,我将自己改进的卷积模块叫做Ghost_REBNCONV,有两重意思,一个是指它和灵魂一样轻,另一方面是形象地描述了张量进入这个模块后,会有一半不参与运算,就像灵魂一样,看不见摸不着。

例子是最好的老师:

例子中原本需要128个卷积核,现在只需要64个卷积核,速度是不是更快了一些,参数量也下降了一下。176MB的模型现在只有150MB,至于效果咋样,拿400个数据集跑一跑,30个做测试。

测试一下pr曲线和roc曲线

不可能像论文中那样来个60万epoch,只是简单的来了100个epoch。

后续:

跑400轮,再用400个数据集测试一下pr和roc,并于原来对比:

可以看出roc低一点,pr高了4点左右。改进的有没有效果,还需要大量的实验进行测试。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1978664.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Day-11 员工管理案例 增删改查、配置文件

SpringBootWeb案例 前面我们已经实现了员工信息的条件分页查询以及删除操作。 关于员工管理的功能,还有两个需要实现: 新增员工修改员工 首先我们先完成"新增员工"的功能开发,再完成"修改员工"的功能开发。而在"新…

Midjourney、Sora和硅谷机密-《分析模式》漫谈15

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 “Analysis Patterns”的Preface(前言)有这么一句: Kent Beck, Ward Cunningham, and Jim Coplein encouraged me to get involved with the commu…

《Advanced RAG》-02-揭开 PDF 解析的神秘面纱

摘要 PDF 文件是非结构化文档的代表,但从 PDF 文档中提取信息是一个具有挑战性的过程。 PDF 文件由一系列指令组成,这些指令指示 PDF 阅读器或打印机在屏幕或纸张上显示符号的位置和方式。与 HTML 和 docx 等文件格式不同,后者使用标记来组织…

8月2日,贪心-买卖股票的最佳时期

大家好呀,今天我们看两道用贪心算法解的两道题,150道经典面试题中的买卖股票的最佳时期1和2。 1.买卖股票的最佳时期1 . - 力扣(LeetCode) 思路 对于这题,我们其实很容易想出暴力解,那就是从后往前找值&…

【文件系统】抽象磁盘的存储结构 CHS寻址法 | sector数组 | LAB数组

目录 1.为什么要抽象 2.逻辑抽象_版本1 2.1sector数组 ​2.2index转化CHS 3.逻辑抽象_版本2 3.1LBA数组 3.2LAB下标转化sector下标 文件其实就是在磁盘中占有几个扇区的问题❗文件是很多个sector的数组下标❗文件是有很多块构成的❗❗文件由很多扇区构成------>文件…

C语言刷题小记3

题目1 序列中删除指定数字 分析:本题要求我们来删除一个序列中指定的数字,这里大家要注意我们要删除的数字可能不止出现一次,所以我们需要用两个变量来进行处理,一个变量来遍历数组,一个变量来存储数组的位置&#xff…

H5 上使用腾讯位置服务选择收货信息

效果图 首先需要在腾讯位置服务上申请你自己的key,可参考地图选点组件 // 点击打开地图 backurl 是点击选中的位置点后,页面跳转至要返回的地址(backurl),会将位置信息添加到回跳地址(backurl&#xff0…

【威胁情报】新的 BingoMod Android 安卓恶意软件伪装成安全应用程序,清除数据

关注公众号网络研究观获取更多内容。 小心 BingoMod!这种危险的 Android 恶意软件会窃取您的钱财、清除您的手机数据并控制您的设备。 了解如何保护自己免受这种阴险威胁。保持在线安全! 计算机安全解决方案提供商 Cleafy 发现了一种狡猾的远程访问木…

PCIe总线-RK3588 PCIe RC初始化流程分析(十二)

1.简介 RK3588 PCIe RC的初始化涉及PCIe设备枚举、中断(INTx、MSI、MSI-X)配置、BAR配置、ATU配置、链路训练等,下面一一介绍。 2.初始化 当RC的模式为RK_PCIE_EP_TYPE时,平台驱动调用rk_add_pcie_port函数初始化RC&#xff0c…

如何将Maven子项目插入到Maven父项目中

Maven项目的融合具体方法: 1.在电脑本地磁盘拷贝Maven子项目; 2.用IDEA软件打开Maven父项目; 3.在IDEA中选中Maven父项目; 4.将复制好的的Maven子项目粘贴到Maven父项目中; 5.选中子项目的pom文件,右键选择…

apk反编译修改教程系列-----修改apk 解除软件限制功能 实例操作步骤解析_5【二十四】

解除apk功能 限制主要是一些app只有付费或者开通vip才可以使用所有功能。这些对于热爱反编译的你是不是比较愤慨,今天继续以一款app为大家来演示如何去除软件的限制功能。教程的目的主要是学习反编译的基础修改方法,了解app的修改步骤以及基础的入门修改常识。 反编译工具:…

无人机无人车固态锂电池技术详解

随着无人机和无人车技术的飞速发展,对高性能、高安全性电池的需求日益迫切。固态锂电池作为下一代电池技术的代表,正逐步从实验室走向市场,为无人机和无人车等应用领域带来革命性的变化。相比传统液态锂电池,固态锂电池在能量密度…

C++中的二维数组

引言 C语言的二维数组可直接用【】【】建立&#xff0c;C的数组更多实用vector<int>表示&#xff0c;那二维数组如何表示呢&#xff1f; 表示法 解读 vector<int>的含义是。 申请了一个连续空间vector&#xff0c;里面的数据是一个个的int vector<vector&l…

Spring - 解析 统一数据格式返回以及统一异常处理

接上篇文章的统一数据格式返回… 文章目录 1. 统一异常处理1.1 使用 2. 统一数据返回和统一异处理是怎么实现的2.1 initHandleAdapters2.2 initHandleExceptionResolvers 1. 统一异常处理 1.1 使用 统一异常处理的两个关键的注解是ControllerAdvice ExceptionHandler Contro…

C++入门基本语法(2)

一、引用 1、基本概念与定义 引用不是新定义一个变量&#xff0c;而是给已存在的变量起一个别名&#xff0c;编译器不会为引用变量开辟内存空间&#xff0c;它和它所引用的变量公用同一块内存空间&#xff1b; 引用的写法&#xff1a;变量类型& 引用别名 变量&#xff…

第六周:机器学习

目录 摘要 Abstract 一、深度学习的优化算法 1、SGD 2、SGDM 3、Adagrad 4、RMSProp 5、Adam算法 二、分类器 三、卷积神经网络 总结 摘要 接着上周学习率在训练中的影响&#xff0c;本周对深度学习常见的几种优化算法做了总结&#xff0c;着重分析Adam算法的优缺…

太阳光强光照射实验在材料科学中的应用

强光照射实验方法 所谓的强光照射即使用人造太阳光模拟器设备模拟太阳光的真实光照环境。强光照射实验是一种在材料科学中常用的实验方法&#xff0c;主要用于研究材料在强烈光照条件下的稳定性、性能变化及其内在机制。实验通常涉及将材料置于特定波长和强度的光源下&#xff…

【vulnhub】DerpNStink靶机

靶机安装 下载地址&#xff1a;DerpNStink: 1 ~ VulnHub 信息收集 靶机IP扫描 nmap 192.168.93.0/24 端口扫描&#xff0c;开放21、22、80端口 nmap -A 192.168.93.158 -p- 目录扫描 dirsearch -u http://192.168.93.158 进行网址访问&#xff0c;页面上只有个单词DeRPn…

IJCAI 2024 | 时空数据(Spatial-Temporal)论文总结

2024 IJCAI&#xff08;International Joint Conference on Artificial Intelligence, 国际人工智能联合会议&#xff09;在2024年8月3日-9日在韩国济州岛举行。 本文总结了IJCAI2024有关时空数据(Spatial-temporal) 的相关论文&#xff0c;如有疏漏&#xff0c;欢迎大家补充。…

【微服务】springboot 整合 SA-Token 使用详解

目录 一、前言 二、认证与授权介绍 2.1 什么是认证 2.1.1 认证的目的 2.1.2 认证基本步骤 2.2 什么是授权 2.2.1 常用的授权模型 三、微服务中常用的认证安全框架 3.1 Spring Security 3.1.1 Spring Security 特点 3.2 JWT (JSON Web Tokens) 3.2.1 JWT特点 3.3 其…