CVPR 2026 | 武大提出OpenDPR：基于扩散模型的开放词汇变化检测模型

news2026/4/7 0:03:21

点击下方卡片关注“CVer”公众号AI/CV重磅干货第一时间送达点击进入—【顶会/顶刊】投稿交流群添加微信号CVer2233小助手拉你进群扫描下方二维码加入CVer学术星球可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用发论文/搞科研/涨薪强烈推荐转载自遥感与深度学习题目OpenDPR: Open-Vocabulary Change Detection via Vision-Centric Diffusion-Guided Prototype Retrieval for Remote Sensing Imagery会议The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026论文https://arxiv.org/abs/2603.27645数据LEVIR-CD、WHU-CD、Hi-UCD mini、SECOND代码https://github.com/guoqi2002/OpenDPR年份2026单位武汉大学、北京理工大学创新点将开放词汇变化检测重新定义为变化定位与类别识别两阶段流程并揭示类别识别错误是主要性能瓶颈提出无需训练的视觉中心扩散引导原型检索框架OpenDPR在视觉空间内进行相似性检索避免了视觉语言模型图文匹配范式的局限性提出空间到变化的弱监督变化检测模块S2C利用视觉基础模型的空间建模能力优化伪标签提升二值变化定位精度将S2C以即插即用方式集成到OpenDPR中形成弱监督变体OpenDPR-W以极少监督代价显著提升开放词汇变化检测性能背景变化检测是遥感领域的基础任务旨在通过比较多时相遥感图像来定位和识别地物变化。现有方法主要分为二值变化检测和语义变化检测两类但均基于封闭集假设仅能识别预定义类别在地物类型多样、标注稀缺的遥感场景中存在明显局限。为突破封闭集假设开放词汇变化检测OVCD被提出旨在识别任意感兴趣的变化类别。现有OVCD方法依赖CLIP等视觉语言模型进行类别识别但图文匹配范式难以精细表征遥感地物类别导致识别精度不足。此外视觉基础模型缺乏双时相变化先验也制约了变化区域的准确定位。数据LEVIR-CD面向建筑物变化检测的遥感数据集用于无监督和弱监督建筑物变化检测评估WHU-CD面向建筑物变化检测的航空与卫星融合数据集用于无监督和弱监督建筑物变化检测评估Hi-UCD mini面向城市语义变化检测的大规模遥感数据集包含水体、草地、建筑、道路、裸地、林地等多类地物用于多类别开放词汇变化检测评估SECOND面向语义变化检测的航空图像数据集包含水体、地面、低矮植被、树木、建筑、操场等类别每对图像均包含变化仅用于评估OpenDPR无弱监督变体方法OpenDPR无训练视觉中心扩散引导原型检索框架多样化原型构建利用大语言模型GPT-4为每个目标地物类别生成丰富的文本描述增强描述多样性基于地理位置和类别外观、纹理、上下文生成多样化描述利用遥感领域扩散模型DiffusionSat合成支持图像集每条描述生成多张图像构建各类别支持集采用APE对合成图像进行类别特定定位获取像素级掩码防止背景语义污染原型使用DINOv2提取特征通过掩码平均池化聚合目标区域特征对各类别特征集进行K-means聚类以聚类中心作为多样化视觉原型相似性驱动视觉检索推理时采用SAM对双时相图像生成初始掩码集通过非极大值抑制去除冗余检测利用DINOv2提取特征结合掩码平均池化获得各候选区域特征基于负余弦相似度计算变化得分筛选变化候选区域提出两种原型检索策略类别均值策略计算候选区域与各类别所有原型的平均相似度取最大值确定类别全局最大策略直接取候选区域与所有原型中最高相似度对应的类别OpenDPR-W弱监督增强变体S2C弱监督变化检测模块预训练采用共享权重孪生编码器提取双时相图像多尺度特征通过逐元素绝对差构建变化特征图利用图像级变化标签计算图像级二值交叉熵损失采用类激活图CAM生成像素级伪标签结合轻量级分割头计算像素级损失引入VFMsSAMDINOv2提取类无关变化候选区域依据与初始伪标签的重叠率筛选并融合生成边界更精确的精细化伪标签推理时增强S2C预测测试图像对的二值变化区域对OpenDPR生成的每个变化候选计算其与S2C变化区域的重叠率保留重叠率超过阈值的候选区域聚合为最终OVCD结果结果与分析OpenDPR在四个基准数据集上均超越现有无监督方法证明了视觉空间原型检索相比图文匹配在遥感场景下的显著优势。OpenDPR-W在弱监督设置下进一步提升了变化定位精度以最少的可训练参数实现了优于同类方法的整体性能。更多图表分析可见原文本文系学术转载如有侵权请联系CVer小助手删文何恺明在MIT授课的课件PPT下载在CVer公众号后台回复何恺明即可下载566页课件PPT大家赶紧学起来CVPR 2026 所有论文和代码下载在CVer公众号后台回复CVPR2026即可下载CVPR 2026 所有论文和代码CV垂直方向和论文投稿交流群成立扫描下方二维码或者添加微信号CVer2233即可添加CVer小助手微信便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖目标检测、图像分割、目标跟踪、人脸检测识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。一定要备注研究方向地点学校/公司昵称如Mamba、多模态学习或者论文投稿上海上交卡卡根据格式备注可更快被通过且邀请进群▲扫码或加微信号: CVer2233进交流群 CVer计算机视觉知识星球人数破万如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料一定要扫描下方二维码加入CVer知识星球最强助力你的科研和工作 ▲扫码加入星球学习▲点击上方卡片关注CVer公众号整理不易请点赞和在看

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2490740.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！