【Dense Res2net:两个非局部注意模型:IVIF】

news2025/8/12 0:08:34

Res2Fusion: Infrared and Visible Image Fusion Based on Dense Res2net and Double Nonlocal Attention Models

(Res2Fusion: 基于密集Res2net和双非局部注意模型的红外和可见光图像融合)

红外和可见光图像融合旨在生成具有出色场景表示和更好视觉感知的合成图像。现有的基于深度学习的融合方法仅利用卷积操作来提取具有局部感受野的特征,而没有充分考虑其多尺度和远程依赖特性,这可能无法保留源图像中一些必要的全局上下文。为此,我们基于密集的Res2net和双重非局部注意模型 (称为Res2Fusion) 开发了一种新颖有效的融合网络。我们将Res2net和密集连接引入具有多个可用感受域的编码器网络,用于提取多尺度特征,并可以为融合任务保留尽可能多的有意义的信息。此外,我们开发了双重非局部注意力模型作为融合层,以对局部特征的远程依赖性进行建模。具体来说,这些注意力模型可以完善编码器网络获得的特征图,以更加关注突出的红外目标和明显的可见细节。最后,综合注意力图用于通过简单解码器网络生成融合结果。

介绍

为了克服上述挑战,我们提出了一种基于密集Res2net和双重非局部注意力模型 (称为Res2Fusion) 的新颖有效的融合网络。我们的Res2Fusion提出了一种编码器-解码器网络,以促进融合规则的设计。在编码器网络中,我们引入Res2net块来提取具有多个可用感受域的多尺度特征图,并应用密集连接以进一步提高特征表示能力。在融合层中,我们采用双重非局部注意力模型来对局部特征的远程依赖进行建模,并生成其相应的空间和通道注意力图。与编码器网络提取的特征图相比,获得的注意力图更多地关注显着的热目标和通常可见的细节。最后,由解码器网络组合并重建注意力图,以生成最终的融合结果。

贡献

1)我们提出了一种新颖有效的融合网络,该网络将Res2net作为卷积块和密集连接引入编码器网络。我们的编码器网络可以有效地提取多尺度深度特征,而无需下采样操作或可变的内核大小,并为融合任务保留更有意义的信息。

2)我们提出了双重非局部注意模型作为融合策略,该模型可以从通道和空间位置建立对局部特征的长期依赖性,以细化特征图,从而更加关注源图像的典型目标和细节。我们的结果在保留典型的热目标和丰富的可见细节之间获得了更好的视觉效果。

3)我们在公开可用的数据集 (即TNO和Roadscene) 上进行了大量实验,结果表明,我们的方法从主观和客观分析中获得了出色的融合性能,超越了其他先进的融合方法。此外,我们的方法在不同的测试数据集上具有很强的鲁棒性。

相关工作

Deep Learning-Based Image Fusion

(对于一些融合方法的表述:略)
尽管这些方法取得了良好的融合性能,但一个不争的事实是,它们的结果不能有效地同时保留高亮度和丰富纹理细节的显著目标。在本文中,我们介绍了一种具有双重非局部注意模型的新颖融合网络,以克服上述问题。与他们的方法不同,我们的Res2Fusion有两个主要的技术贡献。首先,通过引入Res2net作为多尺度卷积块,我们的融合网络是一种新颖而有效的方法,与其他通过利用下采样操作或可变内核大小的方法不同。我们的方法可以有效地提取不同尺度的深层特征,并为融合任务保留更有意义的信息。其次,我们开发了双重非局部注意力模型作为融合层,该模型可以对局部特征的远程依赖性进行建模,以获得其相应的注意力图。这些综合注意力图可以促进融合网络更加关注红外图像的显著目标和可见光图像的典型纹理细节,进一步提高融合性能。

Res2net

请添加图片描述

为了加强CNN的多尺度特性,Gao等人开发了一种新颖的多尺度主干体系结构Res2net,用于对象检测,语义和实例分割等。Res2net的框架如图2所示。Res2net采用不同的数字和不同的比例内核,以分层残差状的方式表示具有不同组滤波器的多个可用接受字段。

对于输入的特征图,首先使用1 × 1卷积来转换通道,并将获得的特征图拆分为s个特征子集。对于每个子集,都有相同的空间大小和1/s通道号,其中s是一个比例控制参数。除第一个子集外的每个子集均由同源3 × 3卷积操作,并添加到下一个特征子集中。然后,将获得的特征图输入到1 × 1卷积层中,并与原始特征级联以获得最终结果

在我们的工作中,将Res2net作为卷积块引入编码器网络,并采用密集连接来进一步提高特征表示能力。与Res2net不同,我们仅保留卷积层和ReLU层,并删除批归一化层。此外,我们在随后的实验中选择s = 4作为比例控制参数。

方法

Network Architecture

在这里插入图片描述
所提出的Res2Fusion如图3所示,它包含三个主要部分,即编码器部分、融合层和解码器部分。

1) Encoder Part:

我们的编码器网络包含一个普通的卷积 (C1) 和两个Res2net块 (Res2net1和Res2net2)。普通卷积层用于提取低级特征,而Res2net块分层聚合多个可用感知域以生成多尺度高级特征。此外,密集连接适用于保留中间特征图,可以很好地重复使用以提高特征表示能力。与现有的提出多核卷积或下采样操作来提取多尺度特征的方法不同,后者不可避免地会丢失一些有用的特征,我们的编码器网络可以在不进行下采样和上采样操作的情况下为图像融合任务保留尽可能多的多尺度特征信息。

2) Decoder Part:

我们的解码器网络由四个普通卷积组成,用于重建结果。所有卷积层均为3 × 3内核大小,具有ReLU激活函数。填充和步幅分别设置为1。因此,我们的融合网络适用于任意分辨率的图像,并保持源图像与特征图具有相同的大小。此外,我们的编码器-解码器网络具有相同的权重,这对于设计某些融合策略很容易且可行。

3) Fusion Layer:

特别是在测试阶段,将源图像单独输入编码器网络以获得其对应的特征图,然后,双非局部注意模型通过计算位置/通道处的响应作为所有位置/通道处特征的加权和,直接建立远程依赖关系。根据特征图的亮度和纹理的相似性,获得的注意力图更多地关注典型目标和细节。

Fusion Strategy

请添加图片描述

为了满足上述训练的编码器-解码器网络,需要设计一种融合策略来生成它们的融合特征图,以便可以通过解码器网络获得融合的结果。实际上,卷积操作是处理本地邻域信息的构建块,并用于生成具有3-D张量的特征。因此,受非局部神经网络的启发,我们设计了双重非局部注意力模型作为融合层,以建模远程依赖关系。图4给出了双非局部注意模型的相应细节。对于多尺度特征图ΦI和ΦV,采用双非局部注意模型来获得它们各自的空间和通道注意图。随后,通过加权融合策略获得双重融合注意力图,称为 Φ s a Φ^{sa} ΦsaF Φ c a Φ^{ca} ΦcaF。最后,我们提出了一个加法融合规则来生成最终的融合注意图F,该图由以下定义:
在这里插入图片描述

1) Spatial Nonlocal Attention Model:

(本章节:一定一定要注意上标,注意维度)
请添加图片描述

如图5所示,对于特征图 Φ∈ R C × H × W R^ {C×H×W} RC×H×W,我们首先对其进行整形并转置为X ∈ R H W × C R^{HW × C} RHW×C,然后使用n × n池化操作,并对其进行整形以生成两个特征图 Φ Y Φ^Y ΦY Φ Z Φ^Z ΦZ ∈ $R^{C × HW/ n 2 n^2 n2 } 。 然 后 , 我 们 对 。然后,我们对 Φ X Φ^X ΦX Φ Y Φ^Y ΦY进行矩阵乘法,并应用softmax运算来计算空间注意图 S s a S^{sa} Ssa ∈ $R^{HW× HW/ n 2 n^2 n2 } $,以下内容:
在这里插入图片描述
在这里插入图片描述

其中R(·) 和 ( ⋅ ) T (·)^T ()T分别出现重塑(reshape)和转置操作。基于上述建模,将多尺度特征图ΦI和ΦV分别输入到空间非局部注意力模型中,可以获得它们的空间注意力图,称为 Φ s a Φ^{sa} ΦsaI Φ s a Φ^{sa} ΦsaV,然后,通过以下方法计算它们的加权空间注意力系数:

请添加图片描述
最后,融合的空间注意力图 Φ s a Φ^{sa} ΦsaF(i,j)由以下内容计算
在这里插入图片描述
在空间注意力模型中,使用n × n池化操作来降低计算复杂度

2) Channel Nonlocal Attention Model:

请添加图片描述

如图5所示,首先将特征图Φ从 R C × H × W R^{C × H × W} RC×H×W重塑为 R C × H W R^{C × HW} RC×HW,然后在重塑Φ和Φ的转置之间执行矩阵乘法。最后,我们应用softmax运算来获得通道注意图 S c a S^{ca} Sca R C × C R^{C × C} RC×C,其定义如下:
在这里插入图片描述
其中 S c a S^{ca} Sca表示第c通道对另一个第c通道的影响。随后,我们再次对$S^{ca}和重塑Φ进行矩阵乘法,并对结果进行重塑以获得通道注意图 Φ c a Φ^{ca} Φca R c × h × w R^{c × h × w} Rc×h×w,该图由以下公式表示:
在这里插入图片描述
类似地,通过通道注意模型获得多尺度特征图ΦI和ΦV的通道注意图,称为 Φ c a Φ^{ca} Φca I Φ c a Φ^{ca} ΦcaV,然后,它们的加权通道注意系数的计算方法如下:
在这里插入图片描述
最后,融合通道注意特征 Φ c a Φ^{ca} ΦcaF(i,j)计算如下:
在这里插入图片描述
请注意,这两个模型的过程非常相似,只是通道模型的第一步是在通道维度上计算相应的注意矩阵。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/33708.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Zabbix最新6.2安装及使用!

zabbix官网 Zabbix 是由 Alexei Vladishev 创建,目前是由 Zabbix SIA 在持续开发和提供支持。 Zabbix 是一款能够监控众多网络参数和服务器的健康度和完整性的软件。Zabbix 使用灵活的通知机制,允许用户为几乎任何事件配置基于邮件的警报。这样可以快速…

数字赋能之学生返乡报备登记管理系统

年关将至,不少高校即将开启寒假模式了。对于不少地方而言,第一批返乡高潮快要到来了。当前,国内疫情防控形势异常严峻,且多地发生外返大学生初筛阳性,为切实保障广大返乡大学生及家人、朋友的身体健康,各个…

MYSQL 基本操作 (2)

分组查询和聚合查询: group by (列名) 根据查询的结果来进行分组,值相同的记录分到一组,然后针对每一组进行聚合。 目前表中,对容易一行进行分组操作都会去除重复名字项,同时将重复项打包进改组,例如&…

TingsBoard源码解析-登录认证-OAuth2认证

配置类:ThingsboardSecurityConfiguration 用户名密码登录 用户名密码登录请求URL: /api/auth/login 配置中发现:在默认的用户名密码认证之前添加了认证拦截器【RestLoginProcessingFilter】,而该拦截器拦截将拦截用户名密码登录请求&#x…

项目管理证书 PMP 的含金量高吗?

PMP 含金量,PMP有没有用,这类问题一直是大家关注的重点,知乎上几个相关问题热度也一直很高。 作为有 7 年项目经验的 PMP 持证者,我要跟大家说句实话: PMP 最基础的是项目管理领域的一个资格认证证书,相当…

FastDFS分布式文件系统

FastDFS分布式文件系统 FastDFS是由国人开发的针对中小文件存储的轻量级分布式文件系统,使用C语言进行开发,效率高、跨平台,可以在类UNIX系统上很好运行。整体设计以简单高效为原则,具有冗余备份、负载均衡、在线扩容等性能。 F…

开源生态企业反哺GitLink确实开源创新服务--DevOps引擎合作

日前,建木正式入驻到GitLink引擎模块下。 建木是DevOps领域的小能手,而GitLink又致力于提供强大的开源基础设施,双方可谓一拍即合,强强联手为开发者提供更愉悦、更轻松的研发体验! GitLink(确实开源&#…

Android结构优化 - Java、Kotlin项目结构分包

随着Android中 Java、Kotlin 的混编开发场景越来越多,其中大多人都会将 java文件 和 kt文件 放在同一个资源文件夹下,在项目越来越大的情况下,我们进行代码查询、项目重构、优化都不太便捷,所以本篇主要记录通过 kotlin分包、java…

MySQL集群:双主模式

目录 1、双主模式 1.1、高可用架构 1.2、MMM架构(基于双主模式) 1.2.1、MMM故障处理机制 1.2.2、MMM监控机制 1.3、MHA架构(基于主从模式) 1.3.1、MHA故障处理机制 1.3.2、MHA优点 1.4、主备切换 1.4.1、主备延迟问题 1.4.2、可靠性优先 1.4.3、可用性优先 2、双主…

关于 Laravel Redis 多个进程同时取队列问题详解

最近在工作中遇到了一个问题,开启多个进程处理队列会重复读取 Redis 中队列吗?是否因此导致重复执行任务?下面就来通过示例代码详细介绍下。 使用 Supervisor 监听 Laravel 队列任务,其中 Supervisor 的配置如下: 1 2…

.net----泛型

泛型泛型的基本概念集合类System. Collections. ArrayList泛型集合类System. Collection. Generic. List<T>ArrayListList<T>泛型的定义和类型参数类型参数<T>泛型类和泛型接口泛型类泛型接口泛型结构泛型方法泛型委托和泛型事件default关键字及协变和逆变协…

手动引入jar包,解决Dependency ‘XXX‘ not found的两种方式

目录引言一、使用systemPath导入&#xff08;一&#xff09;将jar包复制到指定文件夹&#xff08;二&#xff09;在pom文件中引入jar包**这里有一个超级大的坑&#xff0c;就是systemPath不支持聚合工程的父子传导&#xff01;&#xff01;&#xff01;****不支持pom工程的继承…

Linux零基础从入门到精通,必学的55个指令合集【上篇】

Linux学习笔记 资料下载&#xff1a; 链接: https://pan.baidu.com/s/1UvwkJaEJO7W3sU5qkCgKzA?pwdfe2f提取码: fe2f 本篇文章主要适用0基础的读者&#xff0c;内容会比较通俗易懂&#xff0c;也会有详细的图解教程&#xff0c;以及运行后的返回结果。我本人在系统性的学习…

G1D22-安装burpsuiteAttacKG

–0724 还有几分钟&#xff0c;把burpsuite安装一下 —0804 hh当然&#xff0c;和室友聊天去啦hhh java目录下找不到jdk&#xff0c;环境变量没法配emm&#xff0c;重新装一下。 emm原来这个文件夹是在安装时自己创建的 啊啊啊&#xff0c;我是猪emm javasuite闪退是因为环境变…

别瞎扯,元宇宙就是没有切实发展?

前言 最近两年&#xff0c;技术圈比较火的话题之一就是&#xff1a;元宇宙&#xff0c;而且2021年被看作是元宇宙元年&#xff0c;直到现在元宇宙话题依然不断&#xff0c;因为元宇宙在过去的一年里太火了。不管是在国内还是国外&#xff0c;元宇宙太火了&#xff0c;而且与元宇…

WPF项目实战布局--通用固件下载 C#

每个作品都是产品 C# WPF版效果&#xff1a; C# winForm版效果: 一.布局设计UI 1.主体&#xff1a;grid 2行 2列 00 下载按钮 20% 01进度条 80% &#xff08;同时显示百分比&#xff09; 10 11都是跨列 显示日志 2.细节&#xff1a;百分比与进度条Value绑定。下载按钮…

java EE初阶 — 计算机工作原理

文章目录1.操作系统2.操作系统的定位3.进程3.1 进程的基本了解3.2 操作系统内核是如何管理软件资源的3.3 PCB里描述了进程的哪些特征3.3.1 三个较为简单的特征3.3.2 进程的调度属性4.内存管理1.操作系统 操作系统是一个搞管理的软件。 对上要给软件提供稳定的运行环境。对下要…

Java面向对象之——继承

文章目录前言一、继承机制二、继承的语法三、父类成员访问&#x1f351;1、子类中访问父类的成员变量&#x1f351;2、子类中访问父类的成员方法四、super关键字五、子类构造方法六、super和this七、继承关系下的代码执行顺序八、访问限定修饰符protected九、Java继承方式十、f…

C#界面里Control.ImeMode 属性的使用

C#界面里Control.ImeMode 属性的使用 Control.ImeMode 属性是获取或设置控件的输入法编辑器 (IME) 模式。 输入法是一种特殊的程序,可以通过某种方式进行激活。 输入法程序总是在别的程序上面,因此它的运行是一种特殊的状态,所以需要特别处理。 因为电脑当时为了输入26个字…

第 46 届国际大学生程序设计竞赛(ICPC)亚洲区域赛(南京),签到题5题

文章目录A.Oops, Its Yesterday Twice MoreM.Windblume FestivalC.Klee in Solitary ConfinementH.CrystalflyD.Paimon Sorting补题链接&#xff1a;https://codeforces.com/gym/103470 A.Oops, It’s Yesterday Twice More Oops, It’s Yesterday Twice More Input file: st…