DIVFusion:首个耦合互促低光增强图像融合的框架

news2025/7/8 10:04:14

DIVFusion:首个耦合互促低光增强&图像融合的框架

  • DIVFusion:首个耦合互促低光增强&图像融合的框架
    • 写在前面
    • 问题引入
    • Motivation
    • 主要贡献
    • 网络架构
    • 实验验证
      • 融合性能
      • 目标检测性能
      • 消融实验
    • 结论
    • 写在最后

DIVFusion:首个耦合互促低光增强&图像融合的框架

论文:https://doi.org/10.1016/j.inffus.2022.10.034
代码:https://github.com/Xinyu-Xiang/DIVFusion

写在前面

最近Information Fusion接收了一篇题为《DIVFusion: Darkness-free infrared and visible image fusion》的文章。在此之前,图像融合领域一直徘徊在利用互补信息,设计loss,引入新的融合规则等。但是忽视了低光场景下可见光信息退化的问题,这将严重影响互补信息的聚合,也即产生不佳的融合结果。
DIVFusion一文中给出了一个很新的思想来解决低光下的融合问题,即是耦合互促低光增强与融合,以获得良好视觉感知的融合图像。

图像融合系列博客还有:

  1. 图像融合论文及代码整理最全大合集参见:图像融合论文及代码整理最全大合集
  2. 图像融合综述论文整理参见:图像融合综述论文整理
  3. 图像融合评估指标参见:红外和可见光图像融合评估指标
  4. 图像融合常用数据集整理参见:图像融合常用数据集整理
  5. 通用图像融合框架论文及代码整理参见:通用图像融合框架论文及代码整理
  6. 基于深度学习的红外和可见光图像融合论文及代码整理参见:基于深度学习的红外和可见光图像融合论文及代码整理
  7. 更加详细的红外和可见光图像融合代码参见:红外和可见光图像融合论文及代码整理
  8. 基于深度学习的多曝光图像融合论文及代码整理参见:基于深度学习的多曝光图像融合论文及代码整理
  9. 基于深度学习的多聚焦图像融合论文及代码整理参见:基于深度学习的多聚焦图像融合(Multi-focus Image Fusion)论文及代码整理
  10. 基于深度学习的全色图像锐化论文及代码整理参见:基于深度学习的全色图像锐化(Pansharpening)论文及代码整理
  11. 基于深度学习的医学图像融合论文及代码整理参见:基于深度学习的医学图像融合(Medical image fusion)论文及代码整理
  12. 彩色图像融合参见: 彩色图像融合
  13. SeAFusion:首个结合高级视觉任务的图像融合框架参见:SeAFusion:首个结合高级视觉任务的图像融合框架

问题引入

  1. 首先,现有的方法都是在正常的光照条件下设计的,因此忽略了夜间可见图像照度下降的困难。具体而言,在弱光条件下,以往的融合方法仅利用红外信息来填补可见光图像照度退化造成的场景不足。这就导致了夜间可见光图像中丰富的场景信息无法在融合图像中得到表达,背离了红外可见光图像融合任务的初衷。
  2. 其次,一种直观的解决方案是使用先进的微光增强算法对可见图像进行预增强,然后通过融合方法对源图像进行融合。然而,将图像增强和图像融合作为独立的任务处理往往会导致不兼容问题,从而导致图像融合效果不佳,如图1©所示。具体来说,由于夜景光线较弱,夜间可见图像有轻微的颜色失真。弱光增强算法改变了光源的颜色分布,在一定程度上进一步放大了整个图像的颜色失真。
  3. 此外,在融合过程中,由于Y通道的融合策略改变了源图像的饱和度分布,融合后的图像也会发生颜色失真,如图1(b)&©所示。
    图1.Demo

Motivation

红外与可见光图像融合是一项重要的图像增强技术,其目标是在极端环境下生成目标明显、纹理丰富的高质量融合图像。然而,目前的图像融合方法都是针对正常照明下的红外和可见光图像设计的。在夜景中,现有的方法由于可见光图像严重退化,导致纹理细节较弱,视觉感知较差,影响了后续的视觉应用。为此,本文提出了一种无黑暗的红外与可见光图像融合方法(DIVFusion),合理地照亮黑暗,促进互补信息聚合。

主要贡献

  1. 我们提出了一种新的视觉增强的红外和可见光图像融合框架(DIVFusion),以增强视觉感知和整合互补信息,特别是在极弱光条件下。
  2. 设计了一种场景照明解耦网络(SIDNet),消除了退化的照明特征,强化了两种模式的独特特征,以达到视觉增强的目的。构建纹理对比度增强融合网络(TCEFNet),增强对比度和纹理,实现有效的互补信息集成。
  3. 为了保证融合图像的视觉质量,我们设计了一种颜色一致性损失,可以减少融合图像中的颜色失真,并将更多的可见域信息注入到融合图像中。
  4. 我们的融合结果在从源图像中获取互补信息的同时,具有更明亮的场景和更高的对比度,且没有颜色失真,如图1(d)所示。行人检测实验证明了我们的结果在高水平视觉任务中的促进作用。

网络架构

整体网络架构
上述为DIVFusion整体流程图,主要分为两阶段训练
SIDNet
SIDNet用于自监督重构原始图像,并同时,剥离退化照度,得到的特征图用于促进后续融合网络
GRM和Contrast block
上述两者均为作者所提TCEFNet中的组成部分,分别用于细粒度增强与对比度提升,详见原文以及代码。

实验验证

实验设计方面,作者首先在LLVIP,MSRS以及TNO数据集上进行定量和定性的对比实验,然后也给出了运行效率的对比分析以及相关泛化实验和消融实验。

融合性能

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

目标检测性能

在这里插入图片描述

消融实验

在这里插入图片描述

结论

本文提出了一种基于视觉增强的夜间红外与可见光图像融合算法,实现了图像融合与图像增强的耦合互促。具体而言,SIDNet设计的目的是将退化光照特征与混合光照特征分离,避免源图像重要信息的丢失。然后,我们使用包含两个特殊模块的TCEFNet实现融合过程中的对比度增强和纹理保留。考虑到增强和融合任务的不相容性导致的颜色失真,设计了一种颜色一致性损失来调整融合图像的颜色分布。与最先进的方法进行了定性和定量的比较,验证了我们的方法的优越性,包括视觉感知、场景亮度和互补信息集成。两阶段融合实验表明,该方法有效地缓解了融合和增强任务之间的不兼容性。此外,行人检测实验证明了我们的DIVFusion在高级计算机视觉任务中的潜力。

写在最后

本文仅仅考虑到低光对整个红外可见光图像融合的影响,个人感觉红外可见光图像融合未来的研究方向,可以着手于多种退化情况,也即是极端条件下的图像融合,例如在融合过程中同时解决可见光图像中过曝和过暗的问题。现有的融合方法都难以消除过度曝光效应。一种可能的解决方法是利用高斯分布对点光源进行建模,并设计一个分解网络,将过曝光映射从可见图像中剥离出来。由于过曝光区域可见光图像中缺乏有效信息,在融合过程中我们将从红外图像中整合更多的信息来固定过曝光区域。未来,有可能将进一步设计一个照度调整模块,以解决红外和可见光图像融合任务中的低光和过度曝光退化问题。
DIVFusion 为极端条件下的融合提供了可能的方案,正如前面所说的可以在设计图像融合模型的时候进一步考虑其他的极端条件,这与图像融合的本质相契合。

DIVFusion原论文:Tang, Linfeng, Xinyu Xiang, Hao Zhang, Meiqi Gong, and Jiayi Ma. “DIVFusion: Darkness-free infrared and visible image fusion.” Information Fusion (2022). URL: https://www.sciencedirect.com/science/article/pii/S156625352200210X

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/6878.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

攻防世界Running

Running 题目描述:无 题目环境:https://download.csdn.net/download/m0_59188912/87016663 一个可执行文件,执行后显示error,尝试binwalk文件分离。 命令:binwalk -e run.exe浏览分离出来的文件。 末尾发现一个run.ex…

mannose-CHO|甘露糖-醛基|甘露糖-聚乙二醇-醛基|醛基-PEG-甘露糖

mannose-CHO|甘露糖-醛基|甘露糖-聚乙二醇-醛基|醛基-PEG-甘露糖 羰基中的一个共价键跟氢原子相连而组成的一价原子团,叫做醛基,醛基结构简式是-CHO,醛基是亲水基团,因此有醛基的有机物(如乙醛等)有一定的…

APS高级排产软件在快消品行业的应用

快消行业是指消费频率高、使用时限短、拥有广泛的消费群体、对于消费的便利性要求很高的商品销售行业。快消行业的销售渠道种类多而复杂,传统业态和新兴业态等多种渠道并存。快消行业集中度逐步上升,竞争度加大。 随着快速消费品市场的复苏,经…

CNN学习笔记

目录 如何理解卷积层和池化层? 机器视角:长文揭秘图像处理和卷积神经网络架构 卷积神经网络 - 基础知识 激活函数的作用是什么? 激活函数(加入非线性因素) 提高模型鲁棒性(抗干扰能力)&#…

时间复杂度和空间复杂度详解

文章目录 引入 一、时间复杂度的详解及例题 1、时间复杂度的概念 2、时间复杂度的例题训练 2.1 实题训练1 2.2 实题训练2 2.3 实题训练3 2.4 实题训练4 2.5 大O符号(Big O notation)的函数绘图 二、空间复杂度的详解及例题 1、空间复杂的的概念 2、空间复杂度…

Java注解与原理分析

使用的太多,被忽略的理所当然; 一、注解基础 注解即标注与解析,在Java的代码工程中,注解的使用几乎是无处不在,甚至多到被忽视; 无论是在JDK源码或者框架组件,都在使用注解能力完成各种识别和…

【Vue】url拼接参数获取解析

前言: 前端在开发的时候有很多情况下需要提供不带参数的链接或者带参数的链接给自己使用或者给第三方系统,如果提供给第三方系统使用的话一般是第三方需要通过iframe/window.open/a标签打开链接进入对应的页面。 情况一:获取当前浏览器地址栏…

【React二】ref与事件处理与生命周期钩子函数

关于react基础及组件化编程的可以参考本篇笔记 文章目录一、 React中的事件处理1-1 例子: 不要过度使用ref1-2 受控组件与非受控组件1-2-1 受控组件1-2-2 非受控组件1-3 高阶函数1-3-1 函数的柯里化1-3-2 不用柯里化的写法二、生命周期2-1 引出生命周期2-2 组件生命…

TiDB 数据库架构概述

TiDB 数据库架构概述 TiDB体系架构 水平扩容或者缩容金融级高可用实时HTAP云原生的分布式数据兼容MYSQL5.7 Region:存储单位,96~144MB之间,分布式存储在TiKV中 TiKV:默认三副本,将分布式数据存储,并进行存储副本。…

【ARM微型电脑/IoT设备/嵌入式】树莓派安装失败sysstat,成功后还是无法使用sar,并报错:-bash:sar:command not found

1. 安装sysstat报错 安装: sudo apt-get install sysstat错误如下: dpkg: error processing package sysstat (–configure): installed sysstat package post-installation script subprocess returned error exit status 10 Errors were encountered…

1737C - Ela and Crickets

原题链接: Problem - 1737C - Codeforces 题目描述: The problem, which involves a non-standard chess pieces type that is described below, reads: given 33 white crickets on a n⋅nn⋅n board, arranged in an "L" shape next to ea…

详细讲解磁盘及文件系统管理(图例解析)

磁盘及文件系统管理详解 目前市场上主流的磁盘是机械式硬盘 u盘,光盘,软盘,硬盘,磁带 机械式硬盘 【硬盘内部由一个个同心圆组成】如下图: 硬盘内部所有盘片都固定在一根“轴”上,所以:所有…

Vant的List组件列表 滑动后不触底也发送请求的Bug

📃目录跳转📚简介:🎉页面效果:💭使用Float:🧐 问题:🔭div 转为行内块 (解决)🏆总结:📚简介: Vant的…

docke入门基础知识

一、Docker 架构 Docker 包括三个基本概念: 镜像(Image):Docker 镜像(Image),就相当于是一个 root 文件系统。比如官方镜像 ubuntu:16.04 就包含了完整的一套 Ubuntu16.04 最小系统的 root 文件系统。 容…

html前端跨域问题的解决方案

前言: 在前端发出Ajax请求的时候,有时候会产生跨域问题,报错如下: Access to XMLHttpRequest at ‘http://127.0.0.1/api/post’ from origin ‘null’ has been blocked by CORS policy: No ‘Access-Control-Allow-Origin’ header is pre…

WINSOFT ComPort轻松连接到各种串行端口和连接设备

WINSOFT ComPort轻松连接到各种串行端口和连接设备 WINSOFT ComPort是一个Delphi库和CBuilder,通过USB端口连接到输入设备。该库提供CP210x、CP2130、CDC、FTDI、PL2303和CH34x设备。这些标准包括广泛的设备和电气从设备。例如,除了标准输入设备之外&…

Android App开发之利用Glide实现图片的三级缓存Cache讲解及实战(附源码 超详细必看 简单易懂)

需要图片集和源码请点赞关注收藏后评论区留言~~~ 一、利用Glide实现图片的三级缓存 图片加载框架之所以高效,是因为它不但封装了访问网络的步骤,而且引入了三级缓存的机制。具体来说,是先到内存中查找图片,找到了就直接显示内存图…

国内访问Github超级慢?那是你没有用我这个脚本。直接起飞。

导语 之前很多朋友咨询过国内访问Github较慢的问题,然后我一般让他们自己去知乎上找攻略,但今天我才发现网上竟然没有一个一键配置的脚本,一般都需要我们跟着教程一步步地去做才行。这也太麻烦了,于是自己动手写了个脚本&#xf…

2-1 C++类的转换函数与禁止隐士转换(explicit)

1. 转换函数与explicit关键字 1.1 转换函数 下述代码的第5行operator double()即是一个转换函数,通过这个函数,编译器可以在需要的情况下,直接将Fraction类型的对象转换为double类型。这个函数有两个特点:首先因为转换函数的返回…

FFplay文档解读-50-多媒体过滤器四

32.21 showspectrumpic 将输入音频转换为单个视频帧,表示音频频谱。 过滤器接受以下选项: size,s指定输出的视频大小。 有关此选项的语法,请查阅(ffmpeg-utils)视频大小语法。 默认值为4096x2048。 mod…