文献汇总|AI生成图像检测与溯源相关工作(2026)

news2026/4/7 9:57:10
前言本篇博客总结2026年AI生成图像检测与溯源相关工作不定期更新AI-generated image detection algorithm based on classical-quantum hybrid neural network. Science China, 2026.Juncong XU, Han FANG, Yang YANG, Kejiang CHEN, Zhaoyun CHEN, Menghan DOU, Lei QU, Weiming ZHANG, Guoping GUO. 中科大核心思想提出一种面向 AI-generated image detection 的 classical-quantum hybrid neural network试图利用量子神经网络在表示空间和小样本泛化方面的潜在优势提升 detector 对未见生成模型的识别能力。其核心动机在于当前 AIGI detection 的关键仍然是学习更具普适性的判别特征而 QNN 因其量子叠加、纠缠和高维 Hilbert 空间表示被认为可能比纯经典分类器更适合在少量训练样本下学习强泛化表示。为此作者采用 Swin Transformer V2 提取图像全局特征并通过线性层将其降至 4 维后输入一个精心设计的 ALT-based 4-qubit QNN该 QNN 包含 angle encoding、参数化量子电路、额外的 entangler circuit 和单 qubit measurement 输出。这篇论文的重要价值在于展示了 QNN 作为小样本高表达性分类头接入经典视觉 backbone 的可能性并为量子机器学习在 AIGI detection 这一具体任务中的应用提供了一个较完整的实证起点。Light2Lie: Detecting Deepfake Images Using Physical Reflectance Law. NDSS, 2026.Kavita Kumari, Sasha Behrouzi, Alessandro Pegoraro, Ahmad-Reza Sadeghi. TU Darmstadt核心思想作者认为真实图像中的光照反射遵循相对稳定的表面反射规律而生成模型虽然能把纹理和语义做得很像但往往无法稳定复现真实世界中细粒度、物理一致的高光和反射行为。因此他们试图把“图像是否符合真实光反射规律”变成一个检测信号利用真实图像应满足的表面镜面反射物理规律检测生成图像在局部光照与高光一致性上的异常从而实现更具泛化性的深度伪造图像检测。SynerDetect: Hierarchical Synergistic Learning for Generalizable AI-Generated Image Detection. AAAI, 2026.Shuaibo Li, Yijun Yang, Zhaohu Xing, Hongqiu Wang, Pengfei Hao, Xingyu Li, Zekai Liu, Qing Zhang, Lei Zhu 香港科技大学核心思想提出SynerDetect一种面向泛化型 AI 生成图像检测的层次化协同框架其核心动机在于突破当前两类主流 VFM-based detector 的内在局限基于感知模型的方法虽然具有较强的高层语义判别能力却往往难以捕捉细粒度伪造痕迹而基于生成模型重构或反演的方法虽然对低层异常更敏感却缺乏足够的语义推理能力。为此作者提出将 perceptual 与 generative paradigms 在统一框架中深度融合一方面通过 Cross-Model Interactive Distillation 利用 prompt-guided reconstruction 将 generative forensic cues 蒸馏到 perceptual encoder 中增强其对细微伪造信号的敏感性另一方面通过 Optimal Transport-Guided Discriminative Contrastive Learning 对 visual embeddings 与 latent-noise embeddings 进行结构对齐与判别性约束从而构建一个兼具语义判别力和低层伪造敏感性的统一检测空间。总体而言这篇论文的重要价值在于它并不把 perceptual 与 generative 检测视为二选一问题而是提出了一种更系统的跨范式协同思路为构建更鲁棒、更贴近真实世界分布的泛化检测器提供了有力启发。Self-Supervised AI-Generated Image Detection: A Camera Metadata Perspective. TPAMI, 2026.Nan Zhong, Mian Zou, Yiran Xu, Zhenxing Qian, Xinpeng Zhang, Baoyuan Wu 香港城市大学复旦大学核心思想提出一个从 camera metadata / EXIF 视角出发的 AI-generated image detection 框架其核心思想是与其学习不断变化的 fake artifacts不如仅从真实摄影图像中自监督学习相机内在成像规律再把 AI 图像视为偏离该摄影分布的异常样本。为此作者设计了一套 EXIF-induced self-supervised pretext task对 categorical EXIF tags 进行多分类预测对 ordinal 与 continuous tags 进行 pairwise ranking 学习并据此训练一个刻意抑制语义、强化相机残差特征的 feature extractor输入图像先被打乱为无位置 patch再经过高通滤波、卷积编码、协方差池化和 Transformer 建模最终得到紧贴 camera-intrinsic statistics 的表示。在此基础上论文提出了两个 detector一是 SDAIE通过 GMM 对 photographic feature distribution 建模实现 one-class anomaly detection二是 SDAIE†在常规 binary fake/real detection 中引入 EXIF-induced representation alignment regularizer使 supervised classifier 在学习 ProGAN 负样本的同时保持对真实摄影先验的依赖。实验表明SDAIE 即使从未见过 AI-generated images也能在多种 generator 上实现非平凡检测而 SDAIE† 则在 GAN、diffusion、emerging generators 以及 in-the-wild AI 图像上均达到非常强的泛化性能并在 JPEG、模糊和下采样等 benign perturbations 下保持优异鲁棒性。总体来看这篇论文的重要价值在于提出并实证支持了一个很鲜明的观点camera-intrinsic photographic priors 可能比 semantic priors 或 generator-specific fake artifacts 更稳健是构建 forward-compatible AI-generated image detectors 的一条非常有潜力的路线。Penny-Wise and Pound-Foolish in AI-Generated Image Detection. TPAMI, 2026.Yabin Wang, Zhiwu Huang, Su Zhou, Adam Prugel-Bennett, and Xiaopeng Hong. 哈工大 University of Southampton西交核心思想提出PoundNet针对当前训练式 AI 生成图像检测方法普遍存在的“短视 fine-tuning”问题即模型在单一数据集上的二分类性能虽然提升但往往以牺牲预训练视觉知识和跨数据集泛化能力为代价。为此作者基于CLIP设计了由可学习 paired prompts 和 balanced objective 组成的训练框架将 class-agnostic binary detection、semantic preservation 以及 class-aware binary discrimination 结合起来使模型在适配生成图像检测任务的同时尽可能保留原有语义表征。DCNet: Learning Similarity and Spatial Complementary Features for Generalized AI-Generated Image Detection. TCSVT, 2026.Yuxuan Shi, Shaowei Weng, Lifang Yu and Rongrong Ni 福建理工大学核心思想提出DCNet一个面向 generalized AI-generated image detection 的双分支跨阶段交互框架其核心动机在于利用不同生成模型中普遍存在的 upsampling operations 所引入的共享伪影提升 detector 对 unseen generators 的泛化能力。作者观察到在高频残差图中AI-generated images 尤其在低纹理复杂度区域往往呈现出明显的周期性网格状模式而这些模式在不同生成器之间又具有不同的尺度因此单一尺度或单一路径的伪影建模难以兼顾多种生成器。为此DCNet 首先通过 patch sorting 选择最平滑的一半 patch并结合 SRM 提取高频残差随后在双分支结构中一条分支通过 MSEM 在不同 dilation rate 上显式建模周期性相似模式另一条分支通过 SSAM 在 similarity guidance 下提取局部上下文细节两条分支再借助 CBAF 做全局上下文交互与双向补充并通过 LGConv 利用 local multi-scale 与 global contextual information 动态生成卷积核权重与位置权重以进一步强化深层 artifact-related features。实验表明DCNet 在 22 个 GAN 和 diffusion generators 上均表现出优异的 cross-model generalization无论训练于 ProGAN 还是单个 diffusion model ADM它都在平均 Accuracy 和 mAP 上优于现有方法并且在 blur 和 downsampling 扰动下保持最强鲁棒性。总体来看这篇论文的重要价值在于证明了一个很清楚的观点围绕 upsampling artifacts 的“周期模式 局部细节 跨分支交互”联合建模可以显著提升 generalized AI-generated image detection 的跨模型泛化能力但与此同时这种高度依赖高频伪影的路线在 JPEG 压缩下仍然存在明显短板。Semantic Distribution and Authenticity Discrepancy Alignment for AI-Generated Image Detection. TMM, 2026.Jiehua Zhang, Liang Li, Chenggang Yan, Wei Ke, Yihong Gong. 西安交通大学核心思想提出STERM一种面向跨域、跨框架 AI 生成图像检测的特征对齐方法其核心动机在于解决当前两类泛化检测思路之间的矛盾冻结预训练语义空间虽然有利于保留真实世界类别结构但对细粒度伪造痕迹不够敏感而直接 fine-tune 检测器虽然能增强 source-domain 伪造响应却容易破坏预训练语义知识并导致特征空间塌缩为源域偏置的真假二分分布。为此作者在 frozen CLIP 语义特征之上引入轻量 forgery encoder 学习伪造痕迹并通过 semantic distribution alignment 保持特征的绝对语义结构通过 authenticity discrepancy alignment 维持 forgery feature 与 semantic feature 相对于真实性原型的相对几何关系从而在保留语义组织的同时提升对 subtle forgery cues 的敏感性。Adversarial Diffusion Model: Generating High-Quality and Undetectable Images From Scratch. TIFS, 2026Haoyue Wang , Sheng Li , Zhenxing Qian, and Xinpeng Zhang核心思想这篇论文提出了 Adversarial Diffusion ModelADM其核心动机在于突破现有 AI 生成图像对抗样本方法主要依赖后处理、容易引入明显失真的局限转而探索一种能够在 diffusion 采样过程中直接生成高质量、难以被检测器识别图像的 anti-forensic 机制。为此作者在预训练 Stable Diffusion 上引入三项关键设计首先通过 Adversarial Denoising U-Net 在去噪过程中搜索能够误导 surrogate detector 的 adversarial latent其次利用 Latent Compensation Module 调整 adversarial latent 的 reconstruction behavior使其更接近真实图像从而有效攻击 DIRE、LaRE 等基于重构误差的检测器最后通过带有 spectral alignment loss 的 Adversarial Decoder 对齐 adversarial examples 与真实图像的高频频谱特征减弱常见的频域伪造痕迹。实验表明ADM 在多种通用分类器和 AI-generated image detectors 上均能取得更高的 attack success rate同时显著优于现有 post-processing baseline 的图像质量。总体来看这篇论文的重要价值不在于提升检测能力而在于系统性展示了 diffusion 生成过程本身可以被改造成 detector-aware 的 anti-forensic 优化器从而为理解当前检测线索的脆弱性以及未来更鲁棒检测方法的设计提供了重要反向启发。GReX-Bench: Benchmarking Generalization, Robustness, and Explainability in AI-Generated Image Detection. Research Square, 2026.Nusrat Tasnim, Kutub Uddin, Khalid Malik Korea Aerospace University核心思想提出GReX-Bench一个面向 AI 生成图像检测的统一 benchmarking framework其核心动机在于回应当前领域中长期存在的评测碎片化问题现有方法通常依赖不同的数据集、训练协议、评价指标与预处理流程进行实验导致 generalization、robustness 与 explainability 的真实水平难以公平比较。为此作者围绕五个研究问题系统构建评测框架在统一协议下比较了 16 个现有 detector 在 8 个公开数据集上的跨域泛化表现并进一步将 6 类 anti-forensic attacks、5 类 explainability 方法以及 edge / cloud 部署因素纳入综合分析。实验表明许多方法虽然在同分布或特定 benchmark 上表现优异但在跨数据集、跨生成家族以及 AF attacks 下会出现明显性能退化同时不同训练范式scratch、frozen、fine-tuned之间也呈现出清晰差异fine-tuned 方法通常性能最高frozen 方法更稳定而 scratch 方法波动最大。总体而言这篇论文的重要价值在于将 AIGI detection 的评估目标从单一准确率扩展到 generalization、对抗鲁棒性、可解释性与部署可行性的多维框架为后续更可靠、更实用的检测研究提供了一个更系统的比较基准。Transferable Dual-Domain Feature Importance Attack against AI-Generated Image Detector. SPL, 2026Weiheng Zhu, Gang Cao, Jing Liu, Lifang Yu, and Shaowei Weng 中国传媒大学 等核心思想方法名称DuFIA空间域和频域双扰动 General and Domain-Specific Zero-shot Detection of Generated Images via Conditional Likelihood. WACV, 2026. Roy Betser, Omer Hofman, Roman Vainshtein, Guy Gilboa Technion - Israel Institute of Technology Fujitsu Research of Europe 核心思想提出CLIDE一种基于 CLIP 条件似然估计的 zero-shot 生成图像检测方法。其核心思想是不再使用单一的全局真实图像分布来判断图像真假而是针对每张待测图像从真实参考集中选取语义相近的局部样本构建域条件下的 whitening 子空间并在该子空间中计算条件 likelihood。这样模型不仅能在通用场景下保持较强的检测性能还能够自然适配艺术图、受损汽车、发票等窄领域图像显著缓解现有 zero-shot 方法在领域迁移中的性能退化与判别方向翻转问题。Training-free Detection of Text-to-video Generations via Over-coherence. WACV, 2026.Jonathan Brokman, Oren Rachmil, Omer Hofman, Roy Betser, Amit Giloni, Roman Vainshtein, Hisashi Kojima. Fujitsu Research of Europe核心思想提出首个面向 text-to-video 生成内容的 training-free 检测方法是利用生成视频中普遍存在的 temporal over-coherence 现象进行判别。通过冻结视觉编码器提取帧级 embedding计算相邻帧之间的余弦相似度并分别用最大相似度 Γ捕捉局部突发性的过度连贯、用最小相似度 γ表征全局抬升的时间一致性再以自适应方式组合为视频级检测分数证实了“过度平滑的时间动态”是视频生成检测中的有效线索。 The SAFE Image Authenticity Challenge: Detecting and Localizing Partial and Fully Synthetic Manipulations. WACV workshop, 2026. Tai Nguyen, Matthew Stamm, Jill Crisman, Jesse Hostetler, Laura Cassano, Michael Davinroy, Peter Bautista Drexel University 核心思想提出SAFE Image Authenticity Challenge 及其配套数据集 SAFE-FORGE旨在解决当前图像取证研究中“各类伪造任务彼此割裂”的问题。与仅关注全生成图或单一编辑类型的传统 benchmark 不同SAFE 将 splicing、traditional editing、fully AI-generated 和 AI-edited 四类伪造统一纳入同一评测框架并要求系统同时完成 真实性检测、伪造类型分类和像素级伪造区域定位。基线实验表明即便将面向传统编辑的 TruFor 与面向全生成图的 Community Forensics 组合使用系统也仅在 fully AI-generated 图像上表现较强而在 AI-edited 和其他局部编辑图像上的检测与定位性能显著下降说明现有方法难以适应现实中 increasingly common 的 mixed-authenticity imagery。该工作最重要的意义在于它把图像真实性研究从单一二分类任务推进为面向复杂伪造生态的统一、多任务、可解释评测范式。Forensic Detection of Generated MRI Imagery Using Autoregressive Modeling and Frequency Analysis. WACV workshops, 2026.Arpan Mahara, Naphtali Rishe, Malek Adjouadi. Florida International University核心思想检测MRI医学图像CTForensics: A Comprehensive Dataset and Method for AI-Generated CT Image Detection. arXiv, 20260302Yiheng Li, Zichang Tan, Guoqing Xu, Yijun Ye, Yang Yang, Zhen Lei 中科院核心思想检测医学CT图像Prompt-Engineered Detection of AI-Generated Images. New Trends in Intelligent Software Methodologies, Tools and Techniques, 2026Rita FERRARA, Leonardo GALTERI Pegaso Telematic University核心思想测试LLM检测生成图像的能力Localizing Perceptual Artifacts in Synthetic Images for Image Quality Assessment via Deep-Learning-Based Anomaly Detection. Electronics, 2026.Zijin Yin 北邮核心思想提出 Mask-based Semantic Rejection (MSR)将生成图像中的 perceptual artifacts 建模为“语义空间中的异常点”。方法利用预训练 Mask2Former 的语义查询作为 one-vs-all 判别器如果某个区域无法被任何语义类别解释则将其视为 artifact。通过这种 semantic rejection 机制模型无需显式学习 artifact 特征即可实现 zero-shot 或 few-shot 的 artifact localization并在多个图像生成任务上取得了优于现有方法的定位性能。Transformer Based on Multi-Domain Feature Fusion for AI-Generated Image Detection. Electronics, 2026.Qiaoyue Man, Young-Im Cho Gachon University核心思想提出一种基于多域特征融合的Transformer检测框架用于提升 AI 生成图像在复杂开放环境下的真实性判别能力。其核心动机在于克服现有方法各自的局限单纯依赖空间域特征的 CNN/ViT detector 虽然能够学习局部伪影但容易受到域偏移和后处理影响而仅基于频域特征的方法虽然对生成痕迹敏感却缺乏足够强的高层语义建模能力。为此作者采用冻结的 CLIP 提取空间语义特征使用 db4 小波变换提取多尺度高频异常特征并通过 cross-attention alignment 与 gated integration 在 token 级别上实现跨域自适应融合随后利用 Swin Transformer 进行全局上下文建模。这篇论文的重要价值在于展示了一种比较直接且有效的 semantic–frequency hybrid detector 设计思路即通过跨域注意力和门控机制让语义信息与频域痕迹在统一表示空间中协同工作从而提升 AI-generated image detection 的跨模型鲁棒性。What is Real Anymore? A Solution to Detect Hyper Realistic AI-Generated Imagery. CCWC, 2026.Andrew McDonald, Ahmad Al. Doulat, Mohammad Khan, Chelsie Dubay, Jeff Roach. East Tennessee State University核心思想提出Symbiote Particle一种面向 hyper-realistic AI-generated imagery detection 的双流 CNN 检测框架其核心动机在于应对当前 AI 图像高度逼真、肉眼难辨所带来的现实风险并回应现有检测研究在类别适应性、超参数选择方法和真实图像来源可信性方面的不足。为此作者基于经过真实性验证的 WIRA 数据集设计了由 Semantic Contrast Stream 与 SRM Forensic Stream 组成的双流架构分别建模高层语义差异与低层法证残差并通过 recurrent cross attention 实现两类特征交互同时结合交叉熵和 MoCo 风格对比损失进行训练。这篇论文的主要价值不在于提出全新的检测原理而在于强调了真实性可审计数据的重要性并揭示了 AI 图像检测中显著存在的类别依赖现象为后续更细粒度、更可信的数据集构建与检测方法设计提供了启发。FANB-Net: Frequency-Awared Attention and Noise-Injected Boosting for AI-Generated Image Detection. MMM 2026Jiacai Guo, Zili Xu, Jianjie Luo, Lap-Kei Lee, Fu Lee Wang, and Zhenguo Yang核心思想提出FANB-Net一种面向 AI 生成图像检测的双分支频域学习框架其核心动机在于突破现有 frequency-based 方法仅将频谱作为辅助输入、却缺乏针对频域自身结构进行专门建模的局限。为此作者将频域线索进一步拆分为两类互补信息一类是通过 DFT 捕获的全局频谱伪影另一类是通过 DWT 提取的局部、多尺度高频异常并分别设计了 Frequency-Awared Spatial-Channel AttentionFASCA和 Noise-injected High-frequency BoostingNHB模块来增强这两类频域特征的判别能力与泛化能力。这篇论文的重要价值在于它将“频域有效”这一常见观察进一步推进为“global frequency 与 local multi-scale frequency 应分别建模并协同使用”的具体框架为基于频率线索的泛化检测提供了更细粒度、也更具工程实用性的思路。Privacy-preserving and zero-shot detection strategies for multimodal AI-generated content. Neurocomputing, 2026.Liting Zhang, Peng Xiong, Jintao Wang 皖江工学院核心思想提出一个面向多模态 AI 生成内容的统一检测框架其核心动机在于同时应对跨模态语义对齐、未知生成器泛化以及分布式数据隐私保护这三个现实部署中相互耦合的挑战。为此作者构建了 STRIKE 主干通过多模态编码、manipulation-aware 对比学习、浅层跨模态推理和深层多任务判别实现图像、文本、音频和视频内容的联合检测、定位与解释在此基础上又进一步提出基于真实流形偏离的 zero-shot manifold detection将未见伪造识别改写为对全局特征相对于真实多模态语义流形的几何偏离量化最后通过 FedDetect 将上述表示框架扩展到带有差分隐私与通信优化的联邦学习场景以支持多节点协同训练而不暴露原始数据。这篇论文的价值在于从系统角度提出多模态 AIGC 安全不应被拆解成孤立的检测、泛化和隐私问题而应围绕统一表示进行联合建模但同时其零样本泛化仍主要停留在同一数据生成管线内部自建数据集依赖较强方法的外部可验证性和跨管线推广能力仍需进一步证明。Harnessing attention for cropping and fusion in CLIP-based AIGC detection. Neurocomputing, 2026.Jiaqi Xu, Yanhui Du, Liangwei Lyu, Chenrui Yang 中国人民公安大学核心思想提出一种面向 CLIP-based AIGC detection 的适配框架其核心动机在于指出当前许多 CLIP detector 的性能瓶颈并不只来自模型本身而是源于输入预处理与参数微调策略没有真正对齐图像取证任务。作者认为CLIP 原本为图文语义对齐而设计常规 resize 会抹除微弱生成痕迹而 random crop 又常产生语义不完整、仅包含背景的 patch使得 CLIP 难以形成有取证价值的表示同时传统的 q/v attention tuning 更容易学习 GAN 数据中的低频结构形变缺乏对现代 diffusion model 的泛化能力。为此论文提出 Attention-Guided Saliency Cropping (AGSC)利用 CLIP 自身浅层 attention 在跨层统计中持续高响应的 patch 来定位 dominant subject并通过加权质心方式裁出兼具语义完整性与 artifact-rich 的区域在模型适配上则采用 LoRA 仅微调 FFN 层避免 attention tuning 对 generator-specific distortions 的过拟合最后通过对全部 24 层 [CLS] token 做 learnable weighted aggregation联合利用浅层的局部纹理信息与深层的全局语义信息。总体来看这篇论文的重要价值在于说明CLIP 并非不能胜任 AIGC detection而是必须在输入裁剪与参数适配两个层面显式弥合 semantic backbone 与 forensic task 之间的 task-gap特别是 FFN tuning 与 attention-aware cropping 的结合为 CLIP 学习更通用的高频生成伪影提供了一条很有启发性的路线。E2GenF: Universal AIGC image detection based on edge enhanced generalizable features. PRL, 2026.Jian Zoua, Jun Wang b, Kezhong Lua, Yingxin Lai, Kaiwen Luo, Zitong Yu. 深圳大学大湾区大学核心思想提出E²GenF一种基于边缘增强通用特征的 AIGC 图像检测方法其核心动机在于重新审视生成模型中上采样操作所引入的棋盘格伪影并指出这些伪影并非均匀分布于整张图像而是在高频边缘区域更容易暴露。基于这一观察作者首先使用 Sobel 算子提取图像边缘信息并将其重新叠加到原图中以强化边缘感知的高频细节随后通过设计的 Scaled Residual Block 模拟生成模型中常见的 2× 上采样—下采样过程并通过与原始特征作差来显式提取插值残差最后将这些增强后的特征输入轻量 Xception backbone 做真假分类。实验表明E²GenF 在 AIGCDetectBenchmark、TDDMDeepBenchmark 和 TUFIMBenchmark 三个 benchmark 上都表现出很强的 cross-model generalization不仅在 ProGAN 训练和 LDM 训练两种 regime 下都保持稳定而且对多种 GAN 和 diffusion generators 均取得领先或接近领先的准确率同时它在光照变化、对比度变化和下采样扰动下也表现出较强鲁棒性。总体来看这篇论文的重要价值在于提供了一个非常清晰的 edge-aware artifact detection 视角与其在整张图上平均寻找通用伪影不如显式聚焦那些最容易暴露插值痕迹的高频边缘区域再围绕这些区域学习 residual correlations以提升 generalized AIGC image detection 的跨模型泛化能力。Dynamic Ensemble of Deepfake Detectors Conditioned on CLIP Features. Computer Vision Winter Workshop, 2026.Patricie Petrilakova and Jan Cech Czech Technical University in Prague核心思想提出一种基于 CLIP 条件化的动态 detector ensemble用于提升 deepfake / fake-image detection 在未见生成器和常见图像退化条件下的泛化与鲁棒性。其核心动机在于现有公开 detector 虽然各自掌握了不同类型 synthetic content 的判别能力但单个模型往往存在明显的专长局限与泛化短板因此作者不再追求单一最优 detector而是将多个预训练 detector 作为专家池并利用 frozen CLIP visual embeddings 为每张输入图像动态预测专家权重从而通过加权凸组合形成最终判别。这篇论文的价值不在于提出新的法证线索而在于展示了一种实用而有效的 detector orchestration 思路在 fake-image detection 场景中不同 detector 的价值是条件性的而利用高层视觉语义特征来动态分配 detector 的信任度可以比单模型或静态集成更稳地应对异构生成器与复杂后处理。IoT-Oriented Security for Small Sensor Systems Using DnCNN Denoising and Multimodal Feature Fusion for Image Forgery Detection. Sensors, 2026.Nimra Nasir, Syeda Sitara Waseem, Muhammad Bilal, Syed Rizwan Hassan. The Govt. Sadiq College Women University Pakistan核心思想提出MultiFusion一种将 SRM 噪声残差、EfficientNet-B0 局部纹理特征和 ViT-Tiny 全局结构特征进行融合的图像篡改检测框架并在前端加入 DnCNN 去噪预处理旨在通过多线索协同提升传统图像伪造检测的准确性与可解释性。其核心动机在于克服单一特征检测器在复杂篡改场景下的局限强调噪声、局部纹理和全局语义结构是互补的取证线索。这篇论文的价值主要体现在一个较为直接的多模态工程整合方案它说明在传统篡改检测任务中多类取证特征的融合依然有效但与此同时论文在应用叙事上明显超出了实验支撑范围其关于 CCTV、IoT 和传感器安全的主张尚未通过真实数据验证且所谓 ablation study 实际为理论预估而非实证消融因此在解读时需要将其视为一篇“面向传统图像篡改的多线索融合原型”而非已经充分验证的 IoT 场景图像安全解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2411538.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…