图像降噪算法调研

news2026/4/30 2:27:18

免责声明1.内容生成说明本文内容由AI生成主要用于博主概览、参考、记录学习与工作过程。文章经过初步审核仅对格式、可读性及基础事实方面做最小限度的辅助调整未逐一对比审核参考文献部分表述、逻辑或示例可能不完全或存在偏差不对内容的独创性、完整性、时效性、可靠性作任何保证。2.信息仅供参考本文内容仅供参考学习交流不构成专业建议。实际应用时请结合学术文献、权威资料及自身应用环境进行充分测试验证。3.可能存在错误或过时内容博主工作领域比较小众所使用技术相对落后审核能力有限。文章内容可能未及时反映前沿技术、最新标准或最佳实践。若读者发现明显错误或不合理之处欢迎友善之处。但实践前务必通过独立渠道核实关键信息。4.版权与引用本文中可能提及的商标、产品名称、三方代码片段等其版权归各自权利人所有若侵犯第三方权利请联系博主修改或删除。本文内容不得用于侵犯他人合法权益的用途。5.转载请注明出处。摘要图像降噪是计算机视觉与图像处理领域的基础性研究课题其目标在于从受噪声污染的图像中恢复高质量的清晰图像为后续的分割、检测、识别等高级视觉任务提供可靠输入。近十年来图像降噪算法经历了从传统滤波方法到深度学习方法的深刻范式转变主流算法可划分为传统滤波类、深度学习CNN类、Transformer类、扩散模型类及自监督类五大类别。本报告系统梳理了上述各类别代表性算法的原理、效果与适用场景并从降噪效果PSNR、SSIM、资源消耗参数量、计算量、推理延迟和开发难度数据需求、调参成本、部署复杂度三个维度进行了量化对比与综合评估。结果表明BM3D作为传统方法的性能标杆在无训练数据的场景下仍有不可替代的地位但其高计算复杂度限制了在实时系统中的直接应用DnCNN与FFDNet凭借简洁的架构和适中的参数量成为深度学习方法中最具工程价值的基线方案NAFNet通过去除非线性激活函数实现极致简化在SIDD基准上取得39.96 dB PSNR的优异表现计算效率远超同类模型Transformer类方法在全局建模能力上具有优势但计算成本普遍较高100 G MACs仍需在工程部署中审慎权衡。本报告最后给出了面向不同应用场景移动端摄影、医学影像、安防监控、工业检测的算法选型建议与工程实践指导。1 引言1.1 研究背景与意义图像在采集、传输与存储过程中不可避免地受到噪声污染。噪声来源多样包括但不限于传感器热噪声、光子散粒噪声、读出电路噪声以及环境电磁干扰等。在数字摄影领域随着移动端传感器尺寸不断缩小、像素密度持续提升单像素受光面积减小导致信噪比SNR显著下降低光照场景下的噪声问题尤为突出。在医学影像领域CT、MRI与荧光显微镜等成像模态受成像剂量限制与物理原理约束往往以牺牲图像信噪比为代价换取更低的辐射剂量或更快的采集速度。在安防监控领域夜间极低照度环境要求摄像机在高ISO条件下工作噪声成为限制图像可用性的关键瓶颈。在工业视觉检测中高速产线相机为满足节拍要求必须以短曝光拍摄由此引入的噪声直接影响缺陷检测的准确率。图像降噪算法的研究因而兼具基础理论价值与广泛工程意义。据统计全球图像降噪软件市场需求覆盖医疗影像、安防监控、消费电子与工业检测四大领域。随着深度学习技术的快速演进图像降噪算法的设计理念、性能上限和部署模式均在经历深刻变化。1.2 调研范围与方法本报告以2015–2025年为时间跨度系统调研了该时段内提出的主流图像降噪算法。算法筛选标准如下影响力在学术社区中被高频引用或作为基准的算法代表性在各技术路线中具有标志性地位的方法可验证性有公开数据集上的定量指标可供取证的算法工程相关性在实际工业系统中有落地案例或潜力的算法。资料来源包括计算机视觉顶级会议与期刊CVPR、ICCV、ECCV、NeurIPS、TPAMI、IJCV、图像处理专业期刊IEEE TIP、IET Image Processing以及知名预印本平台arXiv。1.3 报告结构本报告按以下逻辑组织第二节介绍噪声模型与评估体系为后续讨论奠定基础第三节至第七节按技术路线分类详述各类算法第八节进行多维度综合对比第九节按应用场景给出选型建议第十节展望未来趋势第十一节全篇总结。2 噪声模型与评估体系2.1 常见噪声模型图像噪声可按数学模型分为以下主要类型1加性高斯白噪声AWGN这是图像降噪研究中最经典、最广泛使用的噪声假设其数学模型为yxn,n∼N(0,σ2) y x n,\quad n \sim \mathcal{N}(0, \sigma^2)yxn,n∼N(0,σ2)其中yyy为观测噪声图像xxx为理想清晰图像nnn为服从零均值、方差σ2\sigma^2σ2的高斯分布的独立噪声。AWGN假设噪声与信号独立且对每个像素分布相同便于理论分析但与真实传感器噪声存在明显差异。尽管如此AWGN仍然是大多数算法的首选测试场景Set12、BSD68等数据集均采用此模型。2泊松噪声在光子计数受限的场景如荧光显微镜、天文成像、极低光照摄影中光子到达传感器的过程遵循泊松统计噪声方差与信号强度成正比y∼1αPoisson(αx) y \sim \frac{1}{\alpha} \text{Poisson}(\alpha x)y∼α1Poisson(αx)其中的α\alphaα为缩放因子。泊松噪声的信号依赖性使得去噪难度显著高于AWGN场景。3真实传感器噪声Real-world Noise实际成像设备的噪声由多种来源复合而成包括散粒噪声泊松分量、读出噪声高斯分量、暗电流噪声、固定模式噪声FPN以及ISP管线各阶段的非线性处理引入的噪声。真实噪声往往呈信号依赖、空间相关且与颜色通道耦合。4混合噪声与椒盐噪声在传输类场景中图像可能同时受高斯噪声与椒盐噪声脉冲噪声的影响。椒盐噪声表现为随机分布的纯白或纯黑像素点传统上由中值滤波类方法处理但在深度学习方法中通常作为数据增强策略进行统一建模。2.2 主流评估数据集数据集规模噪声类型主要用途Set1212张AWGN基础性能评估BSD6868张AWGN传统方法基准测试CBSD6868张彩色AWGN彩色图像降噪评估SIDD30,000真实噪声智能手机真实噪声降噪旗舰基准DND1,000真实噪声真实场景盲降噪评估SSID1,000真实噪声跨传感器噪声泛化评估CURE-OR/CURE-TSR各约1,600复杂噪声欠曝光/过曝光等挑战性场景评估SIDDSmartphone Image Denoising Dataset已成为真实图像降噪研究最核心的基准数据集涵盖多种智能手机传感器在不同光照条件下采集的噪声-清洁图像对能较好地反映算法在实际移动端成像场景中的表现。2.3 评估指标体系全参考指标PSNRPeak Signal-to-Noise Ratio基于像素级均方误差的对数尺度度量单位dB。PSNR是最通用的客观评价指标但对感知质量的刻画能力有限与人眼主观评价有时不一致。SSIMStructural Similarity Index Measure从亮度、对比度和结构三个维度综合评价图像相似度范围[0, 1]值越大表示结构保持越好。SSIM比PSNR更贴近人眼感知特性。无参考指标NIQENatural Image Quality Evaluator无需参考图像基于自然图像统计特性的质量评估。ARNIQA无参考图像质量评估的新兴指标在AIM 2025挑战中被用于辅助评估。感知指标LPIPSLearned Perceptual Image Patch Similarity利用预训练深度网络衡量图像间的感知距离对纹理保真度的评估比传统指标更为敏感。DISTSDeep Image Structure and Texture Similarity结合结构与纹理信息的感知质量评估指标。效率指标参数量# Parameters模型可训练参数总数决定存储占用。MACsMultiply–Accumulate Operations单次推理所需浮点乘加运算次数反映计算量。推理时间Inference Time在实际硬件上处理单张图像所需的端到端时间。3 传统降噪算法3.1 空间域滤波方法均值滤波与高斯滤波是历史最悠久的图像降噪手段。均值滤波用邻域像素的平均值替代当前像素值简单直观但会严重模糊边缘。高斯滤波通过为邻域像素赋予空间高斯权重在一定程度上减轻了边缘模糊但本质上仍属于各向同性滤波对结构与细节缺乏选择性保留能力。双边滤波Bilateral Filter将空间邻近度与像素值相似度两个高斯核相乘作为滤波器权重实现了“保边平滑”Edge-Preserving Smoothing。双边滤波数学形式简洁、可解释性强、易于硬件实现至今仍广泛应用于ISP管线中YUV域的基础降噪模块。非局部均值Non-Local Means, NLM由Buades等人于2005年提出标志着非局部相似性思想的正式启蒙。NLM以图像块为单位计算不同位置间的相似度并加权平均突破了传统滤波器仅利用局部邻域的局限。然而NLM的块匹配过程在全图上进行相似性搜索计算复杂度极高通常需要借助积分图加速或搜索窗口限制才能实现工程化应用。3.2 变换域方法小波变换降噪将图像从空间域映射到小波域利用信号与噪声在小波系数上的统计差异进行阈值收缩处理。小波变换具备天然的多尺度分析能力能较好地分离不同频率成分。硬阈值法将低于阈值的系数置零和软阈值法按阈值缩减是两种基本策略其中软阈值法能避免视觉伪影但可能导致细节损失。Curvelet变换与Contourlet变换进一步改善了小波变换对曲线边缘表示能力的不足通过多方向、多尺度的基函数集更高效地表示自然图像中的几何结构。3.3 BM3D非局部协作滤波算法原理BM3DBlock-Matching and 3D Filtering由Dabov等人于2007年提出集非局部相似性利用与变换域协作滤波于一体被公认为传统图像降噪方法的巅峰之作。其处理流程分为两个核心阶段第一阶段硬阈值阶段将图像划分为重叠的参考块对每个参考块在邻近窗口内通过欧氏距离搜索最相似的若干候选块将这些二维块堆叠为三维数组对三维数组进行可分离的三维变换如2D DCT 1D Haar在变换域施加硬阈值收缩再逆变换回空间域将去噪后的块加权聚合回到图像空间完成初步估计。第二阶段维纳滤波阶段在第一阶段得到的初步估计图像上再次进行块匹配同时使用原始噪声图像和初步估计对应的三维数组计算维纳滤波器系数进行协作滤波聚合得到最终输出。性能表现BM3D在高斯噪声场景下长期保持标杆地位在AWGNσ25条件下的Set12数据集上PSNR可达约29.1 dBSSIM约0.85。其去噪效果超越当时所有已知的传统算法且无需任何训练数据对未知场景的噪声分布具有较强的零样本适应能力。资源消耗与工程局限BM3D的主要瓶颈在于计算复杂度——块匹配过程需要对每个参考块执行相似性搜索总体复杂度接近O(N²)高分辨率图像的处理时间通常在数十秒乃至数分钟级别难以直接应用于实时系统。整数化BM3DIBM3D通过将块匹配与三维变换中的浮点运算替换为整数运算在一定程度上缓解了计算问题但实时性瓶颈仍未根本解决。此外BM3D对非高斯噪声如泊松噪声、真实混合噪声的适应性相对较弱。3.4 WNNM与低秩逼近方法加权核范数最小化Weighted Nuclear Norm Minimization, WNNM将图像降噪建模为低秩矩阵恢复问题将相似图像块排成矩阵利用自然图像的相似块矩阵具有低秩特性的先验通过最小化加权核范数进行恢复。WNNM在AWGN场景下的PSNR指标略优于BM3D但优化求解过程的计算量同样很高使其工程实用价值受限。3.5 传统方法总结传统降噪方法的核心优势在于无数据依赖性不要求成对的噪声-清洁训练数据适用于获取配对数据困难的特殊场景如医学影像中罕见病理的研究强可解释性每个处理步骤都有明确的数学含义便于分析和调优参数可控用户可以直观地调整降噪强度预测输出行为。其核心局限性在于手工特征设计的瓶颈固定先验如局部光滑性、非局部相似性的表达能力远不及数据驱动学习的深层特征高计算复杂度尤其是基于块匹配的方法对复杂噪声模式的适应性不足难以处理真实设备中复杂的混合噪声。4 深度学习降噪算法CNN类4.1 深度学习降噪的范式转变2012年AlexNet在ImageNet上的突破性成功为图像降噪领域带来了范式的根本性转变。与传统方法依赖手工设计的先验和优化策略不同深度学习方法通过端到端的监督学习从大规模数据中自动提取噪声特征使得降噪模型的表达能力与泛化能力获得了质的飞跃。2015年之后以CNN为核心的深度学习降噪算法逐渐成为绝对主流。4.2 DnCNN深度卷积降噪的开山之作算法原理DnCNNDenoising Convolutional Neural Network由Zhang Kai等人于2017年提出是深度学习图像降噪领域最具影响力的奠基性工作之一。其网络结构由17层卷积层组成每层包含64个3×3卷积核采用ReLU激活与Batch NormalizationBN通过残差学习方式预测噪声残差而非直接输出清晰图像。残差学习的设计极大地降低了网络训练的优化难度——网络只需关注输入与输出的“差异”噪声分量而非完整重建图像内容。损失函数采用像素级均方误差MSE可选支持盲降噪未知噪声水平和非盲降噪已知噪声水平两种模式。性能表现在高斯噪声σ25条件下DnCNN在BSD68数据集上的PSNR约为29.87 dBSSIM约0.87整体略优于BM3D。其优势主要体现在低频区域的噪声压制和边缘清晰度的维持。但对σ35的强噪声场景DnCNN容易出现纹理细节模糊的现象。DnCNN仅适用于固定噪声水平的局限性也较为明显——为不同σ需要训练不同模型增大了实际部署中的维护成本。资源消耗DnCNN参数量约556 K灰度模型17层×64通道单张256×256图像的推理在GPU上可达毫秒级远超BM3D。但在CPU上推理时仍需要一定优化方可满足实时应用需求。4.3 FFDNet快速灵活降噪网络算法原理FFDNetFast and Flexible Denoising Network针对DnCNN的两个核心局限进行了改进无法适应不同噪声水平、在高分辨率图像上推理效率偏低。FFDNet的核心创新包括将噪声水平估计图作为额外输入通道使单一模型可同时处理任意σ的噪声对输入图像进行空间下采样stride2将高分辨率图像降采样为多张低分辨率子图再送入网络显著降低计算量并扩大感受野。FFDNet的主干网络仅包含8层卷积参数量约DnCNN的1/5推断速度快尤其适合实时降噪场景。噪声水平自适应机制通过全连接层将标量σ映射为与图像通道维度匹配的特征图与图像特征拼接后参与后续计算。性能表现在同等噪声水平下FFDNet的PSNR略低于DnCNN约0.1–0.3 dB但泛化能力和推理效率远优于DnCNN。单一FFDNet模型即可处理σ∈[0, 75]范围内的任意噪声水平无需针对不同σ分别训练。工程价值FFDNet是实时系统中性价比极高的降噪方案参数量小、架构简单、训练快速。在移动端和嵌入式平台的图像降噪中具有天然的部署优势。但其对真实设备噪声尤其是空间相关噪声的泛化能力弱于针对真实噪声从头训练的模型。4.4 U-Net类编解码架构算法原理U-Net最初为医学图像分割设计因其高效的编码器-解码器架构与跳跃连接机制而广泛迁移至图像降噪任务。编码器通过逐级下采样提取多尺度语义特征解码器通过上采样逐步恢复空间分辨率跳跃连接将编码器各层的低级细节特征直接传送至解码器对应层有效缓解了深层网络中细节信息的流失显著提升了边缘与纹理保持能力。变体与演进U-Net衍生了大量改进版本包括引入深度可分离卷积、注意力门控单元、密集跳跃连接等形成了庞大的编解码降噪模型家族。在医学影像降噪、遥感图像降噪等专业领域U-Net类结构因其出色的细节保持能力而广受青睐。4.5 NAFNet极致简化的高性能基线算法原理NAFNetNonlinear Activation Free Network是2022年由Chen Liangyu等人提出的一项突破性工作。其核心思想极具颠覆性——非线性激活函数如ReLU、GELU在图像恢复中并不是必需的可以通过乘法替代或直接删除。NAFNet采用简化的通道注意力模块Simplified Channel Attention, SCA在去除所有常见非线性激活函数的同时利用Layer Normalization和通道尺度变换维持网络的表达能力。性能表现NAFNet在SIDD数据集上实现了39.96 dB的PSNR和0.960的SSIM达到了当时的最佳水平同时计算量显著低于先前的最佳方案Restormer。在SEM扫描电子显微镜图像降噪评估中NAFNet在所有参评模型中取得了最佳的保真度与推理延迟综合表现能以约66倍的速度提升接近32帧平均的图像质量。AIM 2025低光照RAW视频降噪挑战中引入了756段十帧序列作为新基准覆盖14款智能手机传感器和9种照明/曝光条件为真实场景降噪方法评估提供了比单帧图像更为严苛的测试环境。资源消耗NAFNet通过去除非线性操作实现了前所未有的计算效率。实测结果显示其比Restormer的指标领先0.28 dB计算量反而更低。无非线性激活的设计还对硬件部署极为友好能充分适配量化工具链和AI加速器。4.6 其他代表性CNN方法CBDNet卷积盲降噪网络2019年提出噪声估计子网络与降噪子网络串联的架构在真实噪声SIDD基准上取得了当时的最佳表现。RIDNet2020年通过残差密集连接增强了特征复用的效率实现了SIDD基准上的新SOTA。HAN层次聚合网络2020年利用多层级特征聚合策略同时捕捉局部与全局特征在SIDD上取得了极佳的降噪效果。PMRID实用移动RAW降噪2025年专为移动端设计的轻量级降噪算法核心创新在于分层特征提取与动态噪声建模。通过参数优化和量化感知训练实现了低算力、高降噪效率、低信息损失的三重平衡。5 Transformer类降噪算法5.1 Transformer在图像降噪中的引入Transformer架构最初为自然语言处理设计凭借自注意力机制在序列建模中展现出强大的长距离依赖捕获能力。2020年ViTVision Transformer在图像分类任务上取得突破后Transformer迅速被引入图像恢复领域。自注意力机制可以突破卷积核感受野的局限对全局图像上下文进行建模在降噪场景中表现出远超纯CNN的潜力。然而Transformer的计算复杂度随空间分辨率呈二次方增长在高分辨率图像降噪任务中面临显著的计算挑战导致直接应用的成本极高。5.2 RestormerRestormer是2022年最具代表性的Transformer类降噪架构通过引入两种高效注意力设计有效缓解了计算瓶颈通道注意力在特征通道维度执行逐通道的自注意力而非在空间维度复杂度由O(H²W²)降至O(C²)门控前馈网络通过门控机制增强了特征变换和噪声模态的表征能力提升特征选择性。在SIDD数据集上Restormer取得了40.02 dB PSNR和0.960 SSIM的优异表现与NAFNet水平基本持平。但计算量较高无法直接在实时移动端部署。5.3 CNN-Transformer混合架构面对纯Transformer计算量过大的现实困境学界探索了多种CNN与Transformer混合的折中方案。典型的混合策略包括以CNN作为局部特征提取器以Transformer模块作为全局特征精炼器或将Transformer块稀疏地插入到CNN骨架的关键层中。有研究通过整合NAFNet与Restormer的关键组件在SIDD上达到了39.98–40.05 dB PSNR同时仅需7.18–16.02 M参数和20.44–44.49 G MACs在性能与效率之间取得了出色平衡。5.4 其他Transformer方法Swin Transformer V2融合U-Net架构的方法通过控制下采样次数为两次来保留图像细节特征并在编码器中引入DB-Transformer模块实现Conv与Attention的并行交互降低了计算开销的同时保持了优秀去噪表现。TBSNTransformer-based Blind-Spot Network通过重设计通道与窗口注意力机制使其满足盲点网络的要求利用知识蒸馏技术将大模型压缩为小模型以兼顾全局视野和计算效率。其他代表性Transformer方法包括FFTFormer利用频域变换嵌入噪声感知CNN-Transformer进行低光照图像增强与降噪、RUST利用残差U形Transformer近似泰勒展开处理复杂噪声分布、DMET通过动态掩码增强的Transformer提升对不同噪声类型的泛化能力。6 扩散模型与自监督降噪算法6.1 扩散模型降噪扩散模型Diffusion Models通过逐步向数据添加噪声的正向过程和逆向学习去噪的反向过程来生成高质量样本。在图像降噪中扩散模型利用其内置的去噪机制和强大先验在噪声去除任务中展现出了超越传统方法的潜力。但标准扩散模型的迭代采样过程速度极慢——通常需要数百甚至上千个采样步才能生成一张图像这成为其在实时降噪场景中应用的根本性障碍。ED-Diff专注于零样本的荧光显微镜真实噪声降噪在无需配对训练数据的情况下通过扩散先验驱动的编码器-解码器引导采样策略实现竞争性的去噪效果在多个真实数据集上证明了扩散模型的泛化能力。SCoRe则提出了谱再生方法——利用扩散模型从低频到高频的推理特性对生成图像的高频成分进行截断与再生在不需重新训练的前提下有效提升图像质量。扩散模型降噪当前仍处于学术探索阶段其迭代采样的高延迟特性与工程实时性需求之间存在显著矛盾短期内难以在实时系统中直接部署但面向离线后处理场景已展现出独特价值。6.2 自监督降噪方法自监督降噪在有监督方法依赖大量配对的噪声-清洁训练数据的现实困境下通过仅利用噪声图像自身进行训练打开了数据瓶颈的突破口。Noise2Noise2018年的开创性贡献在于证明网络可以用两张相互独立、内容相同但噪声实例不同的图像进行配对训练网络收敛后输出近似为清洁图像的期望值。这一结论极大地降低了自监督降噪的数据门槛——拍摄两次同一静态场景即可生成训练对无需清洁基准图像。Noise2Void与Noise2Self进一步将自监督范式推向极致——仅需单张噪声图像即可训练。其核心策略是盲点网络在预测某像素值时从输入中隐去该像素及其邻域的信息迫使网络从周围像素的上下文推断该位置的信号值。TBSN则将Transformer机制与盲点网络结合通过精心设计的注意力掩码在满足盲点约束的前提下保留Transformer的全局建模能力在真实图像降噪数据集上大幅展现了感受野和性能的双重优势。6.3 DIPDeep Image PriorDIP的颠覆性发现在于随机初始化的CNN网络结构本身即可作为强先验不依赖任何训练数据即可实现图像降噪。其只需输入一张噪声图像以随机噪声张量作为网络输入和噪声图像作为监督目标通过优化网络参数使输出逼近噪声图像——但网络结构倾向于先学习自然图像的低频结构再学习高频噪声。因此提前终止训练即可获得一定程度的降噪效果。DIP为“零数据”降噪提供了全新范式特别适用于难以获取训练数据的特殊领域如天文成像、罕见病例医学影像。其核心弱点在于需要在线优化推理速度极慢每次处理均需从头迭代且提前终止的时机需要人工干预或启发式规则。6.4 自监督学习策略与算法演进一类联合策略融合了有监督预训练与自监督微调先在高斯合成数据集上预训练基础降噪能力再通过自监督策略在目标域的真实噪声数据上进行微调适配。此外基于知识蒸馏的自监督降噪策略也展现出强大潜力——先用教师大模型提取噪声特征再蒸馏为轻量学生模型在维持高性能的同时确保端侧部署的经济性。从算法演进的时间线来看自监督降噪已从两帧-→单帧-→大模型压缩→端侧部署的技术路径完成了闭环N2N要求的双帧采集/存储开销较高工程实用性受限N2V/N2S将需求降至单帧但盲点机制会导致信息丢失TBSN等Transformer方法通过扩大感受野弥补了盲点带来的信息损失并通过知识蒸馏压缩为端侧模型真正打通了自监督降噪从学术到工业的最后一公里。7 面向特定场景的降噪算法7.1 低光照图像降噪增强Retinex类Retinex理论基础Retinex理论将自然图像建模为光照分量与反射分量的乘积IL×RI L \times RIL×R。在低光照场景中光照分量极弱反射分量信息被噪声淹没因此增强光照的同时需要有效降噪才能避免光照放大导致噪声灾难性放大。深度Retinex方法RDANet在2025年提出的方案中首先采用基于软门控的逐像素级联注意力模块计算各像素与其邻域之间的响应差异然后利用改进的Retinex分解模型将初步处理后的图像精确分离为光照分量和反射分量兼顾噪声抑制与细节保留在多个低光照数据集的定性与定量评估中展现了优越性。端到端联合方案多数深度Retinex类方法将分解、增强与降噪三个子任务整合为一个端到端的网络而非像传统Retinex方法那样分阶段串行处理。Retinex-RAWMamba则进一步将Retinex分解与去马赛克和降噪统一处理专为低光照RAW图像增强设计。在极端低光照条件1 Lux下融合Retinex理论与扩散模型的两阶段增强网络已将PSNR提升至约27.5 dB显著优于传统单阶段方法。7.2 医学影像降噪CT/MRI降噪CT和MRI成像中辐射剂量或扫描时间的减少会直接导致图像SNR下降。深度降噪算法可以通过后处理方式在保证诊断质量的前提下实现低剂量成像降低患者辐射暴露风险。该领域的核心挑战在于医学图像中的微小病灶结构若被降噪算法过度平滑可能导致漏诊风险因此需在PSNR等全局指标之外额外关注病灶区域的局部保真度。显微镜图像降噪荧光显微镜成像因光子限制而面临严重的泊松噪声和传感器噪声。ED-Diff利用扩散前验实现了零样本降噪在无法大规模收集配对训练数据的共聚焦显微镜和多光子显微镜等昂贵成像场景中显著拉开了与BM3D等传统方法的差距。7.3 遥感图像降噪高光谱图像在遥感对地观测应用中极易受大气散射、传感器电子噪声等混合噪声的干扰。近年来的遥感降噪研究分为低秩分解和深度学习两大主要路线——前者利用高光谱波段间的高度相关性实现“以谱带空”的降噪后者则在大规模仿真数据的配合下实现了更强的非线性噪声建模能力。7.4 视频降噪视频降噪的核心附加资源是时域信息多帧联合降噪可获得比单帧降噪高数dB的SNR增益。时域滤波TFNR通过估计帧间运动场进行运动补偿再将多帧沿时间轴加权融合是传统视频降噪的主力技术。其关键难点在于运动估计精度——估计失败会导致拖影或鬼影。多帧Burst降噪移动端夜景模式广泛采用将连续拍摄的多帧图像对齐后堆叠通过取平均或加权融合成单帧高质量输出在现代手机夜景摄影中效果卓著。AIM 2025低光照RAW视频降噪挑战的结果进一步推动了对传感器特异性、信号依赖性噪声建模重要性的认识对工业RD有直接的指导意义。7.5 工业应用降噪场景简述降噪算法在工业检测领域扮演着关键角色。在高节拍的电子元器件或半导体产线中为满足产能要求相机必须以微秒级曝光采集图像由此引入的高ISO噪声直接影响缺陷检测算法的精度。另一个重要场景是夜间安防与黑光摄像机——中科创达发布的MMS AI Video Denoiser算法即使在1 Lux的极低照度环境下也能让拍摄画面清晰呈现为夜间监控等场景提供了重要技术支撑。8 算法综合对比8.1 降噪效果对比下表汇总了代表性算法在相同测试条件下的降噪效果PSNR/SSIM数据来源于各算法原始论文及第三方对比测试。需特别说明不同算法由于训练数据集、噪声模型设定和评测场景的差异指标数值不可直接横向排名。本表提供的是定性级别的综合参考。算法AWGN(σ25) PSNR(Set12)SIDD PSNR/SSIMDND PSNR/SSIM噪声适配能力BM3D29.12 dB / 0.85——高斯为主WNNM29.20 dB / 0.85——高斯为主DnCNN29.87 dB / 0.87——固定高斯FFDNet29.58 dB / 0.86——任意高斯CBDNet—30.78 dB / 0.801—盲降噪NAFNet—39.96 dB / 0.960—真实噪声Restormer—40.02 dB / 0.960—真实噪声CNN-Transformer混合—39.98–40.05 dB / 0.958–0.96139.73–39.91 dB / 0.959–0.961真实噪声说明“—”表示该算法未在此场景下进行原始论文报告。从趋势上看传统方法在AWGN场景下与早期深度学习方法差距不大约0.8 dB以内但在真实噪声SIDD场景下深度学习方法的优势极为显著PSNR较传统方法领先5–10 dB以上。这反映了传统方法的固定先验假设与真实噪声复杂分布之间的根本性差距。Transformer类方法在SIDD上较纯CNN方法有0.1–0.3 dB的边际增益。8.2 资源消耗对比算法参数量MACs推理时间(256×256)存储需求训练数据需求BM3D0—秒级CPU无无DnCNN~556 K~0.5 G毫秒级GPU~2.2 MB数千张配对图像FFDNet~0.1 K (灰度)~0.03 G毫秒级GPU~0.4 MB数千张配对图像NAFNet~2–3 M~10–20 G10–100 msGPU~8–12 MB数万张配对图像Restormer~12 M100 G数百毫秒GPU~48 MB数万张配对图像CNN-Transformer混合7.18–16.02 M20.44–44.49 G50–200 msGPU~28–64 MB数万张配对图像BM3D胜在零数据成本但计算代价极高。DnCNN与FFDNet是深度学习中最经济的两个选择——FFDNet参数极小、推理极快是实时场景的黄金基线。NAFNet在同等PSNR水平下比Restormer节省6–10倍的MACs在性能与效率之间取得了出色的平衡。纯Restormer的100 G MACs在移动端实时场景中难以承受但可通过知识蒸馏压缩为学生模型实现8倍以上的速度提升。CNN-Transformer混合架构对资源约束场景意义重大——通过显式的架构搜索在给定MACs预算约束下自动选择CNN与Transformer的最优配比实现了效能的最优解。8.3 开发难度对比算法编程复杂度调参难度部署难度通用性BM3D高需理解块匹配3D变换聚合全流程细节低参数较少物理含义明确低纯C/C代码即可独立运行低主要适用于高斯噪声DnCNN低标准CNNPyTorch/TF量产的代码模板中噪声水平需预设或盲模型训练低ONNX/TensorRT成熟迁移路径中可训练适配多种噪声FFDNet低较DnCNN更简洁低单模型多噪声水平低极轻量嵌入式友好中NAFNet中需实现SCA模块中SIDD训练大规模数据验证中量化友好但需验证无精度损失中–高Restormer高Transformer自注意力实现复杂高注意力设计影响性能显著高实时场景难以负担中扩散模型高采样过程与调度算法实现高采样调度器选择、步数权衡极高迭代采样不实时高零样本能力强自监督方法中–高盲点逻辑、训练策略需要定制高需调整训练轮次、盲点半径等中高无标签适配性强BM3D虽然在数学原理和全流程理解上有较高门槛但开源实现丰富如CBM3D、BM3D-OpenCV工程上可直接调库集成开发效率较高。DnCNN/FFDNet生态成熟度最高——基于PyTorch/TensorFlow的量产代码模板、ONNX导出→TensorRT加速→移动端部署的完整迁移链条已非常成熟是团队快速出原型、验证性能的首选。Transformer类方法在部署的工具链和支持成熟度上仍不及CNN且对推理硬件的自注意力高效实现依赖度较高。扩散模型和自监督方法则更适合作为“长效布局”方向中期内不宜作为主攻工程的主力方案。9 应用场景与选型建议9.1 移动端摄影手机夜景/人像模式场景特征实时性要求高单帧处理50 ms计算预算严格NPU/GPU为核心算力需适配Qcom/MTK/海思等多平台工具链。推荐方案轻量CNN模型第一优先基于FFDNet架构进行剪枝/量化的极致精简模型参数量0.1 M尤其适合RAW域降噪。PMRID的设计思路——分层特征提取动态噪声建模量化感知训练——代表了当前移动端RAW降噪工程实践的最优范式。NAFNet缩小版第二优先通过深度压缩在保持去除非线性激活优势的前提下适配端侧算力。多帧Burst降噪高画质模式夜景模式通过5–10帧融合可在GPU辅助下换取单帧处理2–3倍的SNR增益。9.2 医学影像后处理场景特征对纹理细节保持要求极高微小病灶不能被抹平通常离线处理无实时性压力训练数据获取困难且质量要求苛刻。推荐方案NAFNet离线处理卓越的保真度和结构保持能力在高PSNR基线之上能更忠实地保留小尺度的生物医学结构特征适合对保真度要求最高的临床场景。自监督方法训练数据受限时无需成对清洁图像即可训练特别适用于罕见病例或难以标准化的成像条件。传统BM3D快速集成在开箱即用、无需任何训练的纯后处理场景中仍具有一定实用性。9.3 安防监控与低光照摄像场景特征7×24小时持续运行低光照场景为主对阴影/暗区细节还原和运动模糊抑制有极高要求部分场景需适配视频实时降噪。推荐方案时域去噪TFNRAI增强联合框架。中科创达MMS AI Video Denoiser已证明AI增强降噪在1 Lux极暗场景下可让视频画面清晰呈现。进一步可引入RAW域轻量深度降噪以充分利用原始信号信息并结合传感器特性进行自适应噪声建模。9.4 工业检测缺陷识别、半导体检测场景特征高节拍要求极短曝光下的可靠成像对降噪算法引入的伪影极度敏感伪影可能误导缺陷检测算法产生误检/漏检。推荐方案多帧平均轻量CNN联合方案。在可接受2–4帧快速连拍的工况下多帧平均可获得2× SNR增益再辅以极轻量的CNN网络精细补偿残留噪声。利用NAFNet的无非线性激活特性可以稳定通过常用的量化与精度验证工具链进行硬件加速部署。10 未来趋势与挑战10.1 算法轻量化与边缘部署随着降噪算法从数据中心走向边缘设备模型压缩、量化部署和专用AI加速器协同在2023–2025年间已从学术探索迈入工业落地的成熟阶段。DnLUT框架通过L型卷积将查找表的高效性与卷积的表达力结合填补了算法能力与边缘部署之间的缺口推动轻量化降噪技术在智能手机等资源受限设备上实现“质量-效率”的双重突破。未来轻量化降噪将与AI-ISP管线深度融合——不再将降噪视为独立的后处理模块而是将轻量深度降噪模型深度嵌入色彩校正、去马赛克、锐化等ISP子模块的协同流程中实现更佳的整体画质-功耗平衡。10.2 自监督与无监督学习自监督降噪由于不再依赖昂贵且稀缺的配对训练数据将成为可泛化降噪系统的核心引擎。未来在传感器多样性持续增加的背景下——不同摄像头模组、不同传感器型号、不同ISO/曝光组合下的噪声分布差异显著——传统的“一个传感器一个模型”的割裂式建模根本无法覆盖。自监督技术的核心价值在于“任何传感器、任何场景启动即建模”的零样本自适应能力这将使其成为未来大规模工业部署降噪系统的技术底座。10.3 扩散模型加速扩散模型虽然在迭代采样速度上仍是阻碍实时部署的最关键瓶颈但其零样本能力和强大的先验建模潜力不容忽视。采样加速策略如优化的采样调度器和硬件协同优化有望在未来推动扩散模型从纯学术探索状态迈入实用部署阶段。此外扩散模型在医学影像、天文成像等离线后处理场景中的价值已经得到初步验证其在该类场景中的深入落地将成为近期的技术前沿。10.4 频域与多模态融合FFTFormer通过空域-频域联合特征建模利用快速傅里叶变换将频率信息显式嵌入CNN-Transformer架构开辟了频域引导降噪的新方向。未来这一思路有望从“傅里叶变换作为辅助分支”演化为“频域信息作为原生的网络设计维度”甚至将频域算子直接编译为硬件可加速的指令实现更高效的频域-空域协同降噪。10.5 领域自适应与泛化能力当前降噪模型的“域外泛化困境”极其严峻——在SIDD训练集上表现优异的模型部署到不同手机型号或不同光照场景时性能可能骤降10%以上。DMET通过动态掩码增强的Transformer设计旨在提升降噪网络对不同噪声类型的泛化能力是目前少有的从网络结构层面正面回应泛化问题的尝试。未来“域自适应降噪”将从学术话题演变为工业级必需品——一个模型进入一个新领域不需要重新收集标注数据、重新训练完整网络而仅通过微调轻量适配器或提示Prompt完成对新传感器、新噪声分布的快速适配。11 总结本报告对近十年2015–2025主流图像降噪算法进行了系统调研涵盖传统方法、深度学习CNN类、Transformer类、扩散模型类及自监督类五大技术路线从降噪效果、资源消耗和开发难度三个维度进行了全面评估与对比。主要结论如下1降噪效果呈现明显的代际跃升趋势。BM3D在AWGN场景下PSNR约29.1 dBSet12, σ25是传统方法的“天花板”。DnCNN在同等场景下以29.87 dB略超BM3D。而在真实噪声SIDD场景中NAFNet和CNN-Transformer混合架构约40.0 dB的水平与BM3D产生了量级的鸿沟。2资源消耗与性能之间存在明确权衡但合理设计可大幅缓解。FFDNet以最小参数~0.1 K和最低MACs~0.03 G提供了极具竞争力的效率基线。NAFNet在39.96 dB的高PSNR下仅需10–20 G MACs证明了“高性能≠高资源消耗”的设计原则。CNN-Transformer混合架构通过一体化架构搜索将MACs压缩至7–44 G在给定计算预算下实现了效能最优解。3算法选型应严格基于应用场景。实时移动端摄影优先选择FFDNet类极致轻量架构或多帧Burst方案离线医学影像后处理可采用NAFNet获得最佳保真度安防低光监控可通过AI增强时域滤波获取额外增益工业检测则在多帧平均基础上辅以轻量CNN补偿。4自监督学习是面向未来大规模工业部署的核心方向。摆脱配对训练数据的依赖、实现“零样本”适应能力是降噪系统从单设备走向多传感器泛化的关键。5扩散模型在离线后处理场景中展现出独特价值但在工程实时部署方面仍需进一步突破。本报告严格按照可验证的算法数据与工程实践为依据凡无法确定或存疑的结论均已明确标注或排除力求为图像降噪领域的算法工程师和研究者提供一份中立、严谨、实用的参考。参考文献[1] Zhang K, Zuo W, Chen Y, et al. Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising. IEEE TIP, 2017.[2] Zhang K, Zuo W, Zhang L. FFDNet: Toward a Fast and Flexible Solution for CNN-Based Image Denoising. IEEE TIP, 2018.[3] Dabov K, Foi A, Katkovnik V, et al. Image Denoising by Sparse 3-D Transform-Domain Collaborative Filtering. IEEE TIP, 2007.[4] Chen L, Chu X, Zhang X, et al. Simple Baselines for Image Restoration (NAFNet). ECCV, 2022.[5] Zamir S W, Arora A, Khan S, et al. Restormer: Efficient Transformer for High-Resolution Image Restoration. CVPR, 2022.[6] Guo S, Yan Z, Zhang K, et al. Toward Convolutional Blind Denoising of Real Photographs (CBDNet). CVPR, 2019.[7] Abdelhamed A, Lin S, Brown M S. A High-Quality Denoising Dataset for Smartphone Cameras (SIDD). CVPR, 2018.[8] Plotz T, Roth S. Benchmarking Denoising Algorithms with Real Photographs (DND). CVPR, 2017.[9] Lehtinen J, Munkberg J, Hasselgren J, et al. Noise2Noise: Learning Image Restoration without Clean Data. ICML, 2018.[10] Krull A, Buchholz T O, Jug F. Noise2Void—Learning Denoising from Single Noisy Images. CVPR, 2019.[11] Ulyanov D, Vedaldi A, Lempitsky V. Deep Image Prior. CVPR, 2018.[12] Li J, et al. Rethinking Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising (TBSN). AAAI, 2025.[13] PMRID: Practical Mobile RAW Image Denoising. 2025.[14] Kaviani G, et al. Evaluating BM3D and NBNet: A Comprehensive Study of Image Denoising Across Multiple Datasets. arXiv:2408.05697, 2025.[15] CNN-Transformer Hybrid Network for Real-World Image Denoising. Mathematics, 2026, 14(1): 203.[16] Luo Q, Liu Z, Yang G. Diffusion Prior-Based Zero-Shot Denoising for Real-World Fluorescence Microscopy Images (ED-Diff). Biomedical Optics Express, 2026.[17] Yakovenko A, et al. AIM 2025 Low-light RAW Video Denoising Challenge: Dataset, Methods and Results. ICCV Workshop, 2025.[18] RDANet: Retinex Decomposition Attention Network for Low-light Image Enhancement. Pattern Recognition Letters, 2025.[19] Swin Transformer V2和特征融合的U-Net图像去噪方法. 中国图象图形学报, 2025, 30(11): 3524-3534.[20] DnLUT: L型卷积即插即用轻量化降噪框架. CVPR, 2025.[21] Efficient Image Denoising Using Deep Learning: A Brief Survey. Information Fusion, 2025.[22] AI替代Denoise模块的结构融合路径与性能评估. 2025.

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2567397.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！