【CVPR26-Min Tan-杭电】基于多线索学习的伪标签进化融合与优化:用于无监督伪装检测
文章EReCu: Pseudo-label Evolution Fusion and Refinement with Multi-Cue Learning for Unsupervised Camouflage Detection代码https://github.com/JSLiam94/EReCu单位杭州电子科技大学、浙江大学一、问题背景伪装目标检测的核心难点在于目标物体与周边环境高度相似纹理对比度低、边界交融紧密常规的显著性检测方法难以有效识别。而无监督伪装目标检测更是需要在无人工像素级标注的前提下完成检测现有方法主要分为两大范式且均存在明显瓶颈伪标签引导类方法早期依赖静态伪标签生成易引入背景噪声后续的师生网络改进方案又忽略了图像原生感知线索导致边界溢出、语义漂移检测结果不准确特征学习类方法通过注意力机制、环境先验等分离前景和背景特征但缺乏伪标签的显式监督容易造成目标边界模糊、精细纹理细节丢失。此外现有方法普遍将语义可靠性和纹理保真度分开优化形成了语义与感知之间的鸿沟进一步加剧了伪标签漂移和细节退化的问题难以在复杂伪装场景下实现精准检测。二、方法创新研究团队提出的EReCu框架基于DINO的师生网络架构核心创新是将多线索原生感知与伪标签进化融合、局部精修相结合让语义可靠性和纹理保真度通过相互反馈共同进化从根本上解决了现有方法的痛点。框架包含三大核心模块各模块协同作用、层层递进1. 多线索原生感知模块MNP作为整个框架的基础该模块提取图像的原生视觉先验信息融合LBP、DoG等低层纹理特征和冻结ResNet-18提取的中层语义特征构建多线索特征表示同时设计多线索质量度量指标量化前景-背景的可分离性为后续伪标签的进化和精修提供可靠的图像原生监督信号确保所有优化都贴合图像本身的固有特征。2. 伪标签进化融合模块PEF包含进化伪标签学习EPL和谱张量注意力融合STAF两个子模块EPL通过深度可分离卷积实现学生浅层特征与教师深层特征的交互结合Dice损失和MNP损失迭代优化伪标签实现语义去噪和伪标签的动态进化STAF则利用Tucker分解和截断SVD谱滤波融合学生网络多层注意力图在抑制噪声的同时保留语义和结构一致性生成稳定的全局伪标签。3. 局部伪标签精修模块LPR针对全局伪标签易丢失边界和纹理细节的问题利用DINO多头自注意力的空间多样性通过目标感知注意力选择TAS结合注意力熵和MNP感知线索筛选出聚焦目标的注意力头再通过局部伪标签生成LPG从高置信度区域生成精细的局部伪标签结合Dice损失和交叉熵损失优化全局预测结果恢复目标的精细纹理和边界保真度。三大模块形成闭环MNP为PEF和LPR提供原生线索指导PEF生成高质量全局伪标签LPR对全局伪标签进行局部细节精修最终实现结构保留的伪装目标检测。三、实验结果为验证EReCu框架的有效性研究团队开展了全面的实验验证实验设置和结果均表现出优异的性能1. 实验设置数据集训练集融合CAMO-Train1000张和COD10K-Train3040张无标注图像在CHAMELEON、CAMO、COD10K、NC4K四个主流COD基准数据集上进行测试评价指标采用结构度量、加权F值、E度量、平均绝对误差M四大经典指标实现细节以DINO-ViT-S/8为编码器采用AdamW优化器、余弦退火学习率在NVIDIA Tesla V100-SXM2 GPU上完成训练保证实验的可复现性。2. 核心结果定量性能EReCu在四个测试数据集的所有评价指标上均达到SOTA水平全面超越UCOD-DPL、SdalsNet等主流无监督伪装目标检测方法以及TokenCut、FOUND等经典无监督目标分割方法例如在CHAMELEON数据集上达0.7321、M低至0.0716边界和细节检测精度显著提升定性效果在复杂伪装场景下EReCu生成的分割掩码边界更锐利、结构细节更丰富能有效识别深度伪影下的伪装目标相比现有方法更贴合真实标注消融实验移除任一核心模块均会导致性能明显下降MNP与EPL的组合带来最显著的性能提升证明各模块的互补性和整体框架的合理性所有模块的协同集成是实现高性能的关键。四、优势与局限1. 核心优势创新的协同优化思路首次将多线索原生感知与伪标签的进化、精修深度结合实现语义和感知的共同进化填补了两者之间的鸿沟同时解决了伪标签漂移和细节退化两大核心问题高精度的检测效果相比现有方法EReCu在边界对齐、细节感知上表现更优能在复杂伪装场景下生成更准确、更精细的分割掩码泛化能力更强高效的计算与设计采用深度可分离卷积、低秩分解等轻量化操作在保证性能的同时降低计算成本各模块设计贴合伪装目标检测的任务特性针对性强良好的可复现性公开代码和详细的实验设置为后续无监督伪装目标检测的研究提供了可靠的基准。2. 现存局限对纹理特征的依赖性MNP模块依赖低层纹理特征提取在纹理极度模糊、目标与背景几乎无纹理差异的极端伪装场景下检测性能可能出现下降超参数的敏感性框架中部分阈值、可学习参数如注意力选择的阈值、局部伪标签生成的α需通过经验设定在不同类型的数据集上可能需要重新调优检测速度相比部分轻量级无监督检测方法EReCu因包含多层特征融合、迭代优化等步骤在检测推理速度上仍有提升空间暂难以满足实时检测的需求。五、一句话总结杭州电子科技大学与浙江大学团队提出的EReCu框架通过多线索原生感知、伪标签进化融合和局部精修三大模块的协同作用实现了无监督伪装目标检测中语义可靠性与纹理保真度的共同进化在多个基准数据集上达到SOTA性能有效提升了复杂场景下伪装目标的边界检测精度和细节感知能力为无监督伪装目标检测的研究提供了新的思路和基准。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2417946.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!