文献汇总｜AI生成图像检测与溯源相关工作（2026）

news2026/4/7 9:57:10

前言本篇博客总结2026年AI生成图像检测与溯源相关工作不定期更新AI-generated image detection algorithm based on classical-quantum hybrid neural network. Science China, 2026.Juncong XU, Han FANG, Yang YANG, Kejiang CHEN, Zhaoyun CHEN, Menghan DOU, Lei QU, Weiming ZHANG, Guoping GUO. 中科大核心思想提出一种面向 AI-generated image detection 的 classical-quantum hybrid neural network试图利用量子神经网络在表示空间和小样本泛化方面的潜在优势提升 detector 对未见生成模型的识别能力。其核心动机在于当前 AIGI detection 的关键仍然是学习更具普适性的判别特征而 QNN 因其量子叠加、纠缠和高维 Hilbert 空间表示被认为可能比纯经典分类器更适合在少量训练样本下学习强泛化表示。为此作者采用 Swin Transformer V2 提取图像全局特征并通过线性层将其降至 4 维后输入一个精心设计的 ALT-based 4-qubit QNN该 QNN 包含 angle encoding、参数化量子电路、额外的 entangler circuit 和单 qubit measurement 输出。这篇论文的重要价值在于展示了 QNN 作为小样本高表达性分类头接入经典视觉 backbone 的可能性并为量子机器学习在 AIGI detection 这一具体任务中的应用提供了一个较完整的实证起点。Light2Lie: Detecting Deepfake Images Using Physical Reflectance Law. NDSS, 2026.Kavita Kumari, Sasha Behrouzi, Alessandro Pegoraro, Ahmad-Reza Sadeghi. TU Darmstadt核心思想作者认为真实图像中的光照反射遵循相对稳定的表面反射规律而生成模型虽然能把纹理和语义做得很像但往往无法稳定复现真实世界中细粒度、物理一致的高光和反射行为。因此他们试图把“图像是否符合真实光反射规律”变成一个检测信号利用真实图像应满足的表面镜面反射物理规律检测生成图像在局部光照与高光一致性上的异常从而实现更具泛化性的深度伪造图像检测。SynerDetect: Hierarchical Synergistic Learning for Generalizable AI-Generated Image Detection. AAAI, 2026.Shuaibo Li, Yijun Yang, Zhaohu Xing, Hongqiu Wang, Pengfei Hao, Xingyu Li, Zekai Liu, Qing Zhang, Lei Zhu 香港科技大学核心思想提出SynerDetect一种面向泛化型 AI 生成图像检测的层次化协同框架其核心动机在于突破当前两类主流 VFM-based detector 的内在局限基于感知模型的方法虽然具有较强的高层语义判别能力却往往难以捕捉细粒度伪造痕迹而基于生成模型重构或反演的方法虽然对低层异常更敏感却缺乏足够的语义推理能力。为此作者提出将 perceptual 与 generative paradigms 在统一框架中深度融合一方面通过 Cross-Model Interactive Distillation 利用 prompt-guided reconstruction 将 generative forensic cues 蒸馏到 perceptual encoder 中增强其对细微伪造信号的敏感性另一方面通过 Optimal Transport-Guided Discriminative Contrastive Learning 对 visual embeddings 与 latent-noise embeddings 进行结构对齐与判别性约束从而构建一个兼具语义判别力和低层伪造敏感性的统一检测空间。总体而言这篇论文的重要价值在于它并不把 perceptual 与 generative 检测视为二选一问题而是提出了一种更系统的跨范式协同思路为构建更鲁棒、更贴近真实世界分布的泛化检测器提供了有力启发。Self-Supervised AI-Generated Image Detection: A Camera Metadata Perspective. TPAMI, 2026.Nan Zhong, Mian Zou, Yiran Xu, Zhenxing Qian, Xinpeng Zhang, Baoyuan Wu 香港城市大学复旦大学核心思想提出一个从 camera metadata / EXIF 视角出发的 AI-generated image detection 框架其核心思想是与其学习不断变化的 fake artifacts不如仅从真实摄影图像中自监督学习相机内在成像规律再把 AI 图像视为偏离该摄影分布的异常样本。为此作者设计了一套 EXIF-induced self-supervised pretext task对 categorical EXIF tags 进行多分类预测对 ordinal 与 continuous tags 进行 pairwise ranking 学习并据此训练一个刻意抑制语义、强化相机残差特征的 feature extractor输入图像先被打乱为无位置 patch再经过高通滤波、卷积编码、协方差池化和 Transformer 建模最终得到紧贴 camera-intrinsic statistics 的表示。在此基础上论文提出了两个 detector一是 SDAIE通过 GMM 对 photographic feature distribution 建模实现 one-class anomaly detection二是 SDAIE†在常规 binary fake/real detection 中引入 EXIF-induced representation alignment regularizer使 supervised classifier 在学习 ProGAN 负样本的同时保持对真实摄影先验的依赖。实验表明SDAIE 即使从未见过 AI-generated images也能在多种 generator 上实现非平凡检测而 SDAIE† 则在 GAN、diffusion、emerging generators 以及 in-the-wild AI 图像上均达到非常强的泛化性能并在 JPEG、模糊和下采样等 benign perturbations 下保持优异鲁棒性。总体来看这篇论文的重要价值在于提出并实证支持了一个很鲜明的观点camera-intrinsic photographic priors 可能比 semantic priors 或 generator-specific fake artifacts 更稳健是构建 forward-compatible AI-generated image detectors 的一条非常有潜力的路线。Penny-Wise and Pound-Foolish in AI-Generated Image Detection. TPAMI, 2026.Yabin Wang, Zhiwu Huang, Su Zhou, Adam Prugel-Bennett, and Xiaopeng Hong. 哈工大 University of Southampton西交核心思想提出PoundNet针对当前训练式 AI 生成图像检测方法普遍存在的“短视 fine-tuning”问题即模型在单一数据集上的二分类性能虽然提升但往往以牺牲预训练视觉知识和跨数据集泛化能力为代价。为此作者基于CLIP设计了由可学习 paired prompts 和 balanced objective 组成的训练框架将 class-agnostic binary detection、semantic preservation 以及 class-aware binary discrimination 结合起来使模型在适配生成图像检测任务的同时尽可能保留原有语义表征。DCNet: Learning Similarity and Spatial Complementary Features for Generalized AI-Generated Image Detection. TCSVT, 2026.Yuxuan Shi, Shaowei Weng, Lifang Yu and Rongrong Ni 福建理工大学核心思想提出DCNet一个面向 generalized AI-generated image detection 的双分支跨阶段交互框架其核心动机在于利用不同生成模型中普遍存在的 upsampling operations 所引入的共享伪影提升 detector 对 unseen generators 的泛化能力。作者观察到在高频残差图中AI-generated images 尤其在低纹理复杂度区域往往呈现出明显的周期性网格状模式而这些模式在不同生成器之间又具有不同的尺度因此单一尺度或单一路径的伪影建模难以兼顾多种生成器。为此DCNet 首先通过 patch sorting 选择最平滑的一半 patch并结合 SRM 提取高频残差随后在双分支结构中一条分支通过 MSEM 在不同 dilation rate 上显式建模周期性相似模式另一条分支通过 SSAM 在 similarity guidance 下提取局部上下文细节两条分支再借助 CBAF 做全局上下文交互与双向补充并通过 LGConv 利用 local multi-scale 与 global contextual information 动态生成卷积核权重与位置权重以进一步强化深层 artifact-related features。实验表明DCNet 在 22 个 GAN 和 diffusion generators 上均表现出优异的 cross-model generalization无论训练于 ProGAN 还是单个 diffusion model ADM它都在平均 Accuracy 和 mAP 上优于现有方法并且在 blur 和 downsampling 扰动下保持最强鲁棒性。总体来看这篇论文的重要价值在于证明了一个很清楚的观点围绕 upsampling artifacts 的“周期模式局部细节跨分支交互”联合建模可以显著提升 generalized AI-generated image detection 的跨模型泛化能力但与此同时这种高度依赖高频伪影的路线在 JPEG 压缩下仍然存在明显短板。Semantic Distribution and Authenticity Discrepancy Alignment for AI-Generated Image Detection. TMM, 2026.Jiehua Zhang, Liang Li, Chenggang Yan, Wei Ke, Yihong Gong. 西安交通大学核心思想提出STERM一种面向跨域、跨框架 AI 生成图像检测的特征对齐方法其核心动机在于解决当前两类泛化检测思路之间的矛盾冻结预训练语义空间虽然有利于保留真实世界类别结构但对细粒度伪造痕迹不够敏感而直接 fine-tune 检测器虽然能增强 source-domain 伪造响应却容易破坏预训练语义知识并导致特征空间塌缩为源域偏置的真假二分分布。为此作者在 frozen CLIP 语义特征之上引入轻量 forgery encoder 学习伪造痕迹并通过 semantic distribution alignment 保持特征的绝对语义结构通过 authenticity discrepancy alignment 维持 forgery feature 与 semantic feature 相对于真实性原型的相对几何关系从而在保留语义组织的同时提升对 subtle forgery cues 的敏感性。Adversarial Diffusion Model: Generating High-Quality and Undetectable Images From Scratch. TIFS, 2026Haoyue Wang , Sheng Li , Zhenxing Qian, and Xinpeng Zhang核心思想这篇论文提出了 Adversarial Diffusion ModelADM其核心动机在于突破现有 AI 生成图像对抗样本方法主要依赖后处理、容易引入明显失真的局限转而探索一种能够在 diffusion 采样过程中直接生成高质量、难以被检测器识别图像的 anti-forensic 机制。为此作者在预训练 Stable Diffusion 上引入三项关键设计首先通过 Adversarial Denoising U-Net 在去噪过程中搜索能够误导 surrogate detector 的 adversarial latent其次利用 Latent Compensation Module 调整 adversarial latent 的 reconstruction behavior使其更接近真实图像从而有效攻击 DIRE、LaRE 等基于重构误差的检测器最后通过带有 spectral alignment loss 的 Adversarial Decoder 对齐 adversarial examples 与真实图像的高频频谱特征减弱常见的频域伪造痕迹。实验表明ADM 在多种通用分类器和 AI-generated image detectors 上均能取得更高的 attack success rate同时显著优于现有 post-processing baseline 的图像质量。总体来看这篇论文的重要价值不在于提升检测能力而在于系统性展示了 diffusion 生成过程本身可以被改造成 detector-aware 的 anti-forensic 优化器从而为理解当前检测线索的脆弱性以及未来更鲁棒检测方法的设计提供了重要反向启发。GReX-Bench: Benchmarking Generalization, Robustness, and Explainability in AI-Generated Image Detection. Research Square, 2026.Nusrat Tasnim, Kutub Uddin, Khalid Malik Korea Aerospace University核心思想提出GReX-Bench一个面向 AI 生成图像检测的统一 benchmarking framework其核心动机在于回应当前领域中长期存在的评测碎片化问题现有方法通常依赖不同的数据集、训练协议、评价指标与预处理流程进行实验导致 generalization、robustness 与 explainability 的真实水平难以公平比较。为此作者围绕五个研究问题系统构建评测框架在统一协议下比较了 16 个现有 detector 在 8 个公开数据集上的跨域泛化表现并进一步将 6 类 anti-forensic attacks、5 类 explainability 方法以及 edge / cloud 部署因素纳入综合分析。实验表明许多方法虽然在同分布或特定 benchmark 上表现优异但在跨数据集、跨生成家族以及 AF attacks 下会出现明显性能退化同时不同训练范式scratch、frozen、fine-tuned之间也呈现出清晰差异fine-tuned 方法通常性能最高frozen 方法更稳定而 scratch 方法波动最大。总体而言这篇论文的重要价值在于将 AIGI detection 的评估目标从单一准确率扩展到 generalization、对抗鲁棒性、可解释性与部署可行性的多维框架为后续更可靠、更实用的检测研究提供了一个更系统的比较基准。Transferable Dual-Domain Feature Importance Attack against AI-Generated Image Detector. SPL, 2026Weiheng Zhu, Gang Cao, Jing Liu, Lifang Yu, and Shaowei Weng 中国传媒大学等核心思想方法名称DuFIA空间域和频域双扰动 General and Domain-Specific Zero-shot Detection of Generated Images via Conditional Likelihood. WACV, 2026. Roy Betser, Omer Hofman, Roman Vainshtein, Guy Gilboa Technion - Israel Institute of Technology Fujitsu Research of Europe 核心思想提出CLIDE一种基于 CLIP 条件似然估计的 zero-shot 生成图像检测方法。其核心思想是不再使用单一的全局真实图像分布来判断图像真假而是针对每张待测图像从真实参考集中选取语义相近的局部样本构建域条件下的 whitening 子空间并在该子空间中计算条件 likelihood。这样模型不仅能在通用场景下保持较强的检测性能还能够自然适配艺术图、受损汽车、发票等窄领域图像显著缓解现有 zero-shot 方法在领域迁移中的性能退化与判别方向翻转问题。Training-free Detection of Text-to-video Generations via Over-coherence. WACV, 2026.Jonathan Brokman, Oren Rachmil, Omer Hofman, Roy Betser, Amit Giloni, Roman Vainshtein, Hisashi Kojima. Fujitsu Research of Europe核心思想提出首个面向 text-to-video 生成内容的 training-free 检测方法是利用生成视频中普遍存在的 temporal over-coherence 现象进行判别。通过冻结视觉编码器提取帧级 embedding计算相邻帧之间的余弦相似度并分别用最大相似度 Γ捕捉局部突发性的过度连贯、用最小相似度 γ表征全局抬升的时间一致性再以自适应方式组合为视频级检测分数证实了“过度平滑的时间动态”是视频生成检测中的有效线索。 The SAFE Image Authenticity Challenge: Detecting and Localizing Partial and Fully Synthetic Manipulations. WACV workshop, 2026. Tai Nguyen, Matthew Stamm, Jill Crisman, Jesse Hostetler, Laura Cassano, Michael Davinroy, Peter Bautista Drexel University 核心思想提出SAFE Image Authenticity Challenge 及其配套数据集 SAFE-FORGE旨在解决当前图像取证研究中“各类伪造任务彼此割裂”的问题。与仅关注全生成图或单一编辑类型的传统 benchmark 不同SAFE 将 splicing、traditional editing、fully AI-generated 和 AI-edited 四类伪造统一纳入同一评测框架并要求系统同时完成真实性检测、伪造类型分类和像素级伪造区域定位。基线实验表明即便将面向传统编辑的 TruFor 与面向全生成图的 Community Forensics 组合使用系统也仅在 fully AI-generated 图像上表现较强而在 AI-edited 和其他局部编辑图像上的检测与定位性能显著下降说明现有方法难以适应现实中 increasingly common 的 mixed-authenticity imagery。该工作最重要的意义在于它把图像真实性研究从单一二分类任务推进为面向复杂伪造生态的统一、多任务、可解释评测范式。Forensic Detection of Generated MRI Imagery Using Autoregressive Modeling and Frequency Analysis. WACV workshops, 2026.Arpan Mahara, Naphtali Rishe, Malek Adjouadi. Florida International University核心思想检测MRI医学图像CTForensics: A Comprehensive Dataset and Method for AI-Generated CT Image Detection. arXiv, 20260302Yiheng Li, Zichang Tan, Guoqing Xu, Yijun Ye, Yang Yang, Zhen Lei 中科院核心思想检测医学CT图像Prompt-Engineered Detection of AI-Generated Images. New Trends in Intelligent Software Methodologies, Tools and Techniques, 2026Rita FERRARA, Leonardo GALTERI Pegaso Telematic University核心思想测试LLM检测生成图像的能力Localizing Perceptual Artifacts in Synthetic Images for Image Quality Assessment via Deep-Learning-Based Anomaly Detection. Electronics, 2026.Zijin Yin 北邮核心思想提出 Mask-based Semantic Rejection (MSR)将生成图像中的 perceptual artifacts 建模为“语义空间中的异常点”。方法利用预训练 Mask2Former 的语义查询作为 one-vs-all 判别器如果某个区域无法被任何语义类别解释则将其视为 artifact。通过这种 semantic rejection 机制模型无需显式学习 artifact 特征即可实现 zero-shot 或 few-shot 的 artifact localization并在多个图像生成任务上取得了优于现有方法的定位性能。Transformer Based on Multi-Domain Feature Fusion for AI-Generated Image Detection. Electronics, 2026.Qiaoyue Man, Young-Im Cho Gachon University核心思想提出一种基于多域特征融合的Transformer检测框架用于提升 AI 生成图像在复杂开放环境下的真实性判别能力。其核心动机在于克服现有方法各自的局限单纯依赖空间域特征的 CNN/ViT detector 虽然能够学习局部伪影但容易受到域偏移和后处理影响而仅基于频域特征的方法虽然对生成痕迹敏感却缺乏足够强的高层语义建模能力。为此作者采用冻结的 CLIP 提取空间语义特征使用 db4 小波变换提取多尺度高频异常特征并通过 cross-attention alignment 与 gated integration 在 token 级别上实现跨域自适应融合随后利用 Swin Transformer 进行全局上下文建模。这篇论文的重要价值在于展示了一种比较直接且有效的 semantic–frequency hybrid detector 设计思路即通过跨域注意力和门控机制让语义信息与频域痕迹在统一表示空间中协同工作从而提升 AI-generated image detection 的跨模型鲁棒性。What is Real Anymore? A Solution to Detect Hyper Realistic AI-Generated Imagery. CCWC, 2026.Andrew McDonald, Ahmad Al. Doulat, Mohammad Khan, Chelsie Dubay, Jeff Roach. East Tennessee State University核心思想提出Symbiote Particle一种面向 hyper-realistic AI-generated imagery detection 的双流 CNN 检测框架其核心动机在于应对当前 AI 图像高度逼真、肉眼难辨所带来的现实风险并回应现有检测研究在类别适应性、超参数选择方法和真实图像来源可信性方面的不足。为此作者基于经过真实性验证的 WIRA 数据集设计了由 Semantic Contrast Stream 与 SRM Forensic Stream 组成的双流架构分别建模高层语义差异与低层法证残差并通过 recurrent cross attention 实现两类特征交互同时结合交叉熵和 MoCo 风格对比损失进行训练。这篇论文的主要价值不在于提出全新的检测原理而在于强调了真实性可审计数据的重要性并揭示了 AI 图像检测中显著存在的类别依赖现象为后续更细粒度、更可信的数据集构建与检测方法设计提供了启发。FANB-Net: Frequency-Awared Attention and Noise-Injected Boosting for AI-Generated Image Detection. MMM 2026Jiacai Guo, Zili Xu, Jianjie Luo, Lap-Kei Lee, Fu Lee Wang, and Zhenguo Yang核心思想提出FANB-Net一种面向 AI 生成图像检测的双分支频域学习框架其核心动机在于突破现有 frequency-based 方法仅将频谱作为辅助输入、却缺乏针对频域自身结构进行专门建模的局限。为此作者将频域线索进一步拆分为两类互补信息一类是通过 DFT 捕获的全局频谱伪影另一类是通过 DWT 提取的局部、多尺度高频异常并分别设计了 Frequency-Awared Spatial-Channel AttentionFASCA和 Noise-injected High-frequency BoostingNHB模块来增强这两类频域特征的判别能力与泛化能力。这篇论文的重要价值在于它将“频域有效”这一常见观察进一步推进为“global frequency 与 local multi-scale frequency 应分别建模并协同使用”的具体框架为基于频率线索的泛化检测提供了更细粒度、也更具工程实用性的思路。Privacy-preserving and zero-shot detection strategies for multimodal AI-generated content. Neurocomputing, 2026.Liting Zhang, Peng Xiong, Jintao Wang 皖江工学院核心思想提出一个面向多模态 AI 生成内容的统一检测框架其核心动机在于同时应对跨模态语义对齐、未知生成器泛化以及分布式数据隐私保护这三个现实部署中相互耦合的挑战。为此作者构建了 STRIKE 主干通过多模态编码、manipulation-aware 对比学习、浅层跨模态推理和深层多任务判别实现图像、文本、音频和视频内容的联合检测、定位与解释在此基础上又进一步提出基于真实流形偏离的 zero-shot manifold detection将未见伪造识别改写为对全局特征相对于真实多模态语义流形的几何偏离量化最后通过 FedDetect 将上述表示框架扩展到带有差分隐私与通信优化的联邦学习场景以支持多节点协同训练而不暴露原始数据。这篇论文的价值在于从系统角度提出多模态 AIGC 安全不应被拆解成孤立的检测、泛化和隐私问题而应围绕统一表示进行联合建模但同时其零样本泛化仍主要停留在同一数据生成管线内部自建数据集依赖较强方法的外部可验证性和跨管线推广能力仍需进一步证明。Harnessing attention for cropping and fusion in CLIP-based AIGC detection. Neurocomputing, 2026.Jiaqi Xu, Yanhui Du, Liangwei Lyu, Chenrui Yang 中国人民公安大学核心思想提出一种面向 CLIP-based AIGC detection 的适配框架其核心动机在于指出当前许多 CLIP detector 的性能瓶颈并不只来自模型本身而是源于输入预处理与参数微调策略没有真正对齐图像取证任务。作者认为CLIP 原本为图文语义对齐而设计常规 resize 会抹除微弱生成痕迹而 random crop 又常产生语义不完整、仅包含背景的 patch使得 CLIP 难以形成有取证价值的表示同时传统的 q/v attention tuning 更容易学习 GAN 数据中的低频结构形变缺乏对现代 diffusion model 的泛化能力。为此论文提出 Attention-Guided Saliency Cropping (AGSC)利用 CLIP 自身浅层 attention 在跨层统计中持续高响应的 patch 来定位 dominant subject并通过加权质心方式裁出兼具语义完整性与 artifact-rich 的区域在模型适配上则采用 LoRA 仅微调 FFN 层避免 attention tuning 对 generator-specific distortions 的过拟合最后通过对全部 24 层 [CLS] token 做 learnable weighted aggregation联合利用浅层的局部纹理信息与深层的全局语义信息。总体来看这篇论文的重要价值在于说明CLIP 并非不能胜任 AIGC detection而是必须在输入裁剪与参数适配两个层面显式弥合 semantic backbone 与 forensic task 之间的 task-gap特别是 FFN tuning 与 attention-aware cropping 的结合为 CLIP 学习更通用的高频生成伪影提供了一条很有启发性的路线。E2GenF: Universal AIGC image detection based on edge enhanced generalizable features. PRL, 2026.Jian Zoua, Jun Wang b, Kezhong Lua, Yingxin Lai, Kaiwen Luo, Zitong Yu. 深圳大学大湾区大学核心思想提出E²GenF一种基于边缘增强通用特征的 AIGC 图像检测方法其核心动机在于重新审视生成模型中上采样操作所引入的棋盘格伪影并指出这些伪影并非均匀分布于整张图像而是在高频边缘区域更容易暴露。基于这一观察作者首先使用 Sobel 算子提取图像边缘信息并将其重新叠加到原图中以强化边缘感知的高频细节随后通过设计的 Scaled Residual Block 模拟生成模型中常见的 2× 上采样—下采样过程并通过与原始特征作差来显式提取插值残差最后将这些增强后的特征输入轻量 Xception backbone 做真假分类。实验表明E²GenF 在 AIGCDetectBenchmark、TDDMDeepBenchmark 和 TUFIMBenchmark 三个 benchmark 上都表现出很强的 cross-model generalization不仅在 ProGAN 训练和 LDM 训练两种 regime 下都保持稳定而且对多种 GAN 和 diffusion generators 均取得领先或接近领先的准确率同时它在光照变化、对比度变化和下采样扰动下也表现出较强鲁棒性。总体来看这篇论文的重要价值在于提供了一个非常清晰的 edge-aware artifact detection 视角与其在整张图上平均寻找通用伪影不如显式聚焦那些最容易暴露插值痕迹的高频边缘区域再围绕这些区域学习 residual correlations以提升 generalized AIGC image detection 的跨模型泛化能力。Dynamic Ensemble of Deepfake Detectors Conditioned on CLIP Features. Computer Vision Winter Workshop, 2026.Patricie Petrilakova and Jan Cech Czech Technical University in Prague核心思想提出一种基于 CLIP 条件化的动态 detector ensemble用于提升 deepfake / fake-image detection 在未见生成器和常见图像退化条件下的泛化与鲁棒性。其核心动机在于现有公开 detector 虽然各自掌握了不同类型 synthetic content 的判别能力但单个模型往往存在明显的专长局限与泛化短板因此作者不再追求单一最优 detector而是将多个预训练 detector 作为专家池并利用 frozen CLIP visual embeddings 为每张输入图像动态预测专家权重从而通过加权凸组合形成最终判别。这篇论文的价值不在于提出新的法证线索而在于展示了一种实用而有效的 detector orchestration 思路在 fake-image detection 场景中不同 detector 的价值是条件性的而利用高层视觉语义特征来动态分配 detector 的信任度可以比单模型或静态集成更稳地应对异构生成器与复杂后处理。IoT-Oriented Security for Small Sensor Systems Using DnCNN Denoising and Multimodal Feature Fusion for Image Forgery Detection. Sensors, 2026.Nimra Nasir, Syeda Sitara Waseem, Muhammad Bilal, Syed Rizwan Hassan. The Govt. Sadiq College Women University Pakistan核心思想提出MultiFusion一种将 SRM 噪声残差、EfficientNet-B0 局部纹理特征和 ViT-Tiny 全局结构特征进行融合的图像篡改检测框架并在前端加入 DnCNN 去噪预处理旨在通过多线索协同提升传统图像伪造检测的准确性与可解释性。其核心动机在于克服单一特征检测器在复杂篡改场景下的局限强调噪声、局部纹理和全局语义结构是互补的取证线索。这篇论文的价值主要体现在一个较为直接的多模态工程整合方案它说明在传统篡改检测任务中多类取证特征的融合依然有效但与此同时论文在应用叙事上明显超出了实验支撑范围其关于 CCTV、IoT 和传感器安全的主张尚未通过真实数据验证且所谓 ablation study 实际为理论预估而非实证消融因此在解读时需要将其视为一篇“面向传统图像篡改的多线索融合原型”而非已经充分验证的 IoT 场景图像安全解决方案。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2411538.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！