论文阅读笔记《Locality Preserving Matching》

news2025/8/6 17:15:25

核心思想

  该文提出一种基于局部保持的特征匹配方法(LPM)。其核心思想是对于一个正确匹配点,其邻域范围内的其他匹配点与对应目标点之间的变换关系,应该和正确的匹配点保持一致,而错误匹配点,则应该有较大的差别。基于这一假设前提,作者采用KNN算法为每个特征点构建邻域范围,并设计了一个损失函数来计算候选匹配点集中各个匹配对之间的距离损失,差异越大则损失越大。然后,考虑到邻域内拓扑结构的一致性,作者通过引入变换向量之间的距离比值和角度乘积,构成新的距离损失度量函数。最后,通过比较损失值与阈值之间的大小,损失大于阈值的则认为是错误匹配点,否则为正确匹配点。

实现过程

理想刚性变换假设

  首先,给定一个候选匹配点集 S = { ( x i , y i ) } i = 1 N S=\{(x_i,y_i)\}_{i=1}^N S={(xi,yi)}i=1N,该点集可以通过SIFT+BF匹配的方式得到。我们的目标是找到一个正确匹配点集 I ∗ I^* I,其能够使得匹配点之间的距离损失函数 C C C最小化,即
在这里插入图片描述
对于理想的刚性变换来说,距离损失函数可以根据匹配点之间的距离差异来计算,如下式
在这里插入图片描述
其中, d ( , ) d(,) d(,)表示距离度量函数,例如欧氏距离; ∣ ⋅ ∣ |\cdot| 表示集合的元素的数量, λ \lambda λ表示权重系数。第一项表示原图中的两个点之间的距离,应该与目标图像中对应匹配点之间的距离相近,这对于刚体变换来说是成立的,一个物体上的两个点之间距离,经过刚体变换之后距离保持不变。第二项则是用于惩罚错误匹配点数量的正则项。

广义匹配

  上述假设,对于刚性变换是成立的,对于更加复杂的非刚性变换则很难保持了。但在一个较小的邻域范围内,受到物理结构的约束,变换前后两个匹配点邻域范围内其他点的分布情况应该是保持不变的。简单来说就是在原图中 j j j i i i邻域内的点,那么在对应的目标图中 j j j也应该是 i i i邻域内的点,则距离损失函数改写为
在这里插入图片描述
N x i \mathcal{N}_{x_i} Nxi表示 x i x_i xi的邻域,通过KNN算法得到; K K K表示最近邻的数量。由于非刚性变换中,尺度变化的影响,欧氏距离等距离度量方式不再适用于描述点和点之间的关系,因此距离度量函数采用下式的定义方法
在这里插入图片描述
作者还引入了一个新的变量 p i ∈ { 0 , 1 } p_i\in \{0, 1\} pi{0,1},用于表示匹配对 ( x i , y i ) (x_i,y_i) (xi,yi)是否为正确匹配对,如果是则 p i = 1 p_i=1 pi=1,否则 p i = 0 p_i=0 pi=0。将新的距离度量函数和 p i p_i pi带入到原距离损失函数中可得
在这里插入图片描述
其中对于 x j ∈ N x i x_j\in \mathcal{N}_{x_i} xjNxi,其距离 d ( x i , x j ) = 0 d(x_i, x_j)=0 d(xi,xj)=0,同理对于 y j ∈ N y i y_j\in \mathcal{N}_{y_i} yjNyi,其距离 d ( y i , y j ) = 0 d(y_i, y_j)=0 d(yi,yj)=0因此原式中的两项被直接约去了。并且由于距离值 d d d是个二元量,无非是0或1,因此平方项也没有意义,被省略了。然后我们以 ∑ j ∣ x j ∈ N x i d ( y i , y j ) \sum_{j|x_j\in \mathcal{N}_{x_i}}d(y_i,y_j) jxjNxid(yi,yj)这一项为例,看一下他的计算过程
在这里插入图片描述
其中 n i n_i ni表示 x j x_j xj属于 x i x_i xi邻域范围内,且 y j y_j yj也属于 y i y_i yi邻域范围内点的数量。同理可知 ∑ j ∣ y j ∈ N y i d ( x i , x j ) \sum_{j|y_j\in \mathcal{N}_{y_i}}d(x_i,x_j) jyjNyid(xi,xj)也为 K − n i K-n_i Kni。进而距离损失函数可以写为
在这里插入图片描述

邻域拓扑一致性

  上述的距离损失计算过程,只考虑了匹配点邻域范围内其他特征点的分布情况,而没有考虑局部拓扑结构的约束。简单来说,如果在原图中特征点 x j x_j xj x i x_i xi的左侧,那么在变换之后的目标图像中 y j y_j yj也应该在 y i y_i yi的左侧,当然这个说法其实是不严谨的,为方便大家理解局部拓扑结构约束的一个意思。那么如何准确的描述这种局部拓扑一致性约束呢,作者引入了两幅图像匹配点之间的位移向量 v i v_i vi。如下图所示, v i v_i vi是一个由 x i x_i xi指向 y j y_j yj的向量,对于正确匹配的点,其邻域内任意两点之间的位移向量都应该非常接近,而对于错误匹配的点,其邻域内点和点之间的位移向量可能各不相同。
在这里插入图片描述
  基于上述假设,作者利用两个位移向量之间的长度比值和角度的乘积来描述两个向量之间的一致性
在这里插入图片描述
∣ ∣ || 表示L1范数, ( ⋅ , ⋅ ) (\cdot, \cdot) (,)表示内积计算。那么两个向量之间的距离定义如下
在这里插入图片描述
两个向量的相似程度大于等于阈值 τ \tau τ则认为距离为0,否则距离为1。引入新的约束条件后,距离损失函数为
在这里插入图片描述

多尺度邻域

  考虑到对于不同的图像,特征点的分布情况以及误匹配点所占的比例都是不同的,如果采用固定大小的邻域范围是不合适的。因此作者采用多个 K K K的取值, K = { K m } m = 1 M \mathbf{K}=\{K_m\}_{m=1}^M K={Km}m=1M,分别进行计算距离损失,然后在计算平均值作为最终的距离损失
在这里插入图片描述

求解

  上述损失函数经过合并项后,可以简化为
在这里插入图片描述
其中
在这里插入图片描述
我们的优化目标是寻找最优的 p = { p i } \mathbf{p}=\{p_i\} p={pi}使得损失函数 C C C最小。一个直接的求解思路就是,如果 c i > λ c_i>\lambda ci>λ,我们就令 p i p_i pi为0,否则令 p i = 1 p_i=1 pi=1,这样就能使的损失函数 C C C最小,即
在这里插入图片描述
最终的匹配点集为
在这里插入图片描述

邻域构建

  原本邻域是在整个候选匹配点集 S S S中选择最近邻点构建的,则邻域中既有正确匹配点也有错误匹配点。如果能够只在正确匹配点集中选择最近邻点构建邻域,保证邻域内的点都是正确匹配点,这样能过够让正确匹配点之间的相似性更高,而错误匹配点的邻域内的拓扑一致性无法保持,因此距离更大。如何能够尽可能地在正确匹配点集中构建邻域呢?这可是我们地求解目标呀。作者想到了迭代地方式,第一次匹配可以得到一个近似的正确匹配点集 I 0 I_0 I0。在这个基础上重新构建邻域,再次匹配得到最终的匹配点集 I ∗ I^* I
在这里插入图片描述
  算法的伪代码如下
在这里插入图片描述

创新点

  • 提出邻域拓扑一致性的距离计算方法,用于度量两个匹配点之间的距离
  • 提出多尺度和迭代的邻域构建方法

算法评价

  本文可以看作是LGSC的出处,LGSC算法基本延续了LPM的算法思想,只是在距离度量函数上略有不同。作者认为这类方法也属于图匹配的类别,但规避了图匹配所带来的计算负担,使其能够在线性时间内求解。

如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/15773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第一章《初学者问题大集合》第6节:IntelliJ IDEA的下载与安装

当完成了Java开发环境之后,各位读者就可以开始编写第一个Java程序了。可是应该在哪里写程序呢?早期的开发者们都是用纯文本编辑工具编写Java程序,并且在命令行窗口中编译和运行Java程序。时至今日,我们早已远离了那个程序开发的“…

CentOs程序环境准备

1. MySQL的安装启动 选择指定操作系统指定版本的mysql进行下载 MySQL :: Download MySQL Community Serverhttps://dev.mysql.com/downloads/mysql/5.7.html#downloads 选择复制下载链接 回到终端,执行此命令下载 wget https://dev.mysql.com/get/Downloads/MyS…

举个栗子~Tableau 技巧(244):用和弦图(Chord diagram)呈现数据关系

关于和弦图 和弦图(Chord diagram)常用来表示数据之间的相互关系。数据点沿着圆圈分布,通过点和点之间相互连接的弧线来呈现相互之间的关系。和弦图从视觉上来说比较美观,数据呈现又很直观,所以深受数据粉喜爱。 之前…

【Linux初阶】Linux调试器-gdb使用 | gdb的 l/b/info/d/r/n/s/bt/finish/p/(un)display/q

🌟hello,各位读者大大们你们好呀🌟 🍭🍭系列专栏:【Linux初阶】 ✒️✒️本篇内容:gdb使用相关背景知识,gdb的使用(打断点、查断点、消断点、调试运行、查看对应变量&…

【python拼图游戏】图片自选,来挑战一下自己的极限吧~

嗨害大家好鸭!我是小熊猫❤ 拼图的画面多以自然风光、建筑物以及一些为人所熟识的图案的为题材。 城堡和山峦是两类传统的主题, 不过任何图画和影像都可以用做拼图的素材。 有一些公司还提供将私人摄影作品制成拼图的服务。 今天我小熊猫就给带来py…

FFmpeg5.1 解码rtsp 并用OpenCV 播放

RTSP 连接过程如下图 看下实际过程中FFmpeg 的日志情况: [tcp 0000014CC3256D40] No default whitelist set [tcp 0000014CC3256D40] Original list of addresses: [tcp 0000014CC3256D40] Address ::1 port 8554 [tcp 0000014CC3256D40] Address 127.0.0.1 po…

使用BP神经网络、RBF神经网络以及PSO优化的RBF神经网络对数据进行预测(Matlab代码实现)

🍒🍒🍒欢迎关注🌈🌈🌈 📝个人主页:我爱Matlab 👍点赞➕评论➕收藏 养成习惯(一键三连)🌻🌻🌻 🍌希…

Keysight是德科技E5061B网络分析仪-安泰测试

E5061B ENA系列网络分析仪从5Hz 至3GHz提供了广泛的频率范围。它不仅支持一般的射频应用(例如滤波器或放大器测量等),还支持低频应用(例如直流至直流转换器环路增益测量)。因此,它是所有实验台上进行网络分析的最重要工具。 拥有E5061B,您就…

Selenium4 新特性

一、Selenium4 简介 Selenium是一个综合性项目,包含一系列的工具和库,支持Web浏览器的各种自动化操作: 软件测试爬虫领域RPA领域优点: 开源:https://github.com/SeleniumHQ兼容性: Chrome、FireFox、Edeg、IE、Opera、Safari支持多种编程语言:Java、Python、C#、Ruby、…

Charles抓包web、手机、小程序配置

一、下载地址 二、web抓包 Charles Web抓包,启动Charles会自动与浏览器设置成代理,不需要进行过多的设置。接下来就是通过浏览器发送网络请求,Charles就会直接抓取到这些信息和响应信息。 1、抓取HTTPS协议 Charles配置 点击顶部菜单栏【He…

双功能螯合剂p-NCS-Bz-DFO,1222468-90-7,p-SCN-Bn-Deferoxamine特点分析

●外观以及性质: p-SCN-Bn-Deferoxamine属于双功能螯合剂,西安凯新生物科技有限公司是各种修饰性PEG供应商,提供各种品质优良PEG衍生物,分子量从1000-40000不等,纯度≥95%,发货速度快。 ●中文名&#xff…

Web学习笔记-React

笔记内容转载自AcWing的Web应用课讲义,课程链接:AcWing Web应用课。 CONTENTS1. React配置环境2. ES6语法补充3. Components1. React配置环境 React官网:React。 React是一个声明式,高效且灵活的用于构建用户界面的JavaScript库…

凡事预则立,不预则缺货!2022年底了核芯物联蓝牙AOA定位基站GA25缺货!GA10缺货!GA60也缺货!

凡事预则立,不预则缺货!2022年底了核芯物联蓝牙AOA定位基站GA25缺货!GA10缺货!GA60也缺货! 核芯物联岳毅恒 ​ 深圳核芯物联科技有限公司 战略合作拓展总监 凡事预则立,不预则缺货!202222年底…

brython | 初探鼠标事件-1:点击事件

各位前端大佬勿笑话,运维小弟献丑了。 前段时间看见大佬使用【文言文】写了一个连连看,于是我也想用【brython】也实现一个连连看。 于是乎,你们就看到这篇文章和这个项目了。 如果大佬们对brython不是特别了解的话,建议先查看之…

JVM分析工具

JVM在运行过程中,我们可以利用各种工具对JVM进行分析,这是性能调优的利器。可以通过各种工具了解在系统运行过程中,在JVM底层到底发生了什么。JVM分析工具一般分为两种,一种是命令行工具,一种是图形界面工具。 JVM分析…

卷积操作的不同类型

文章目录1. 一维卷积2. 二维卷积3. 三维卷积4. 扩张卷积5. 空洞卷积6. 分组卷积一般而言,一维卷积用于文本数据;二维卷积用于图像数据,对宽度和高度都进行卷积;三维卷积用于视频及3D图像处理领域,对立方体的三个面进行…

CS5269TypeC转HDMI2.0+VGA带PD100W快充拓展坞方案芯片完整设计资料(原理图+PCB文件)

CS5269TypeC转HDMI2.0VGA带PD100W快充方案芯片原理图: 用于US Type-C或DP1.4连接到HDMI2.0转换器。CS5269集成了DP1.4HDMI2.0的输出端和VGA输出接口。另外,两个CC控制器包括CC通信,以实现DP Alt模式和功率传输功能,一个用于上游类…

SD-WAN NFV uCPE VNF

NFV(network function virtulization) NFV(network function virtulization,网络功能虚拟化)是指一种操作框架,目的是为了将部署在COTS硬件上的、在虚拟基础架构中的VNF软件设备编排和自动化起来,然后进行…

精耕丨“银发族”与“熬夜党”都在养生,大健康品牌怎样精耕消费者需求?

“被疫情偷走的这三年”里,健康成为所有人不得不面对的生活命题。 丁香医生《2022国民健康洞察报告》显示,2021年人们平均存在4.8个健康困扰,算得上“人均亚健康”,其中情绪、身材、皮肤焦虑位列TOP3。 人们对稳住健康的追求也一…

5G无线技术基础自学系列 | 物理共享信道分配

素材来源:《5G无线网络优化实践》 一边学习一边整理内容,并与大家分享,侵权即删,谢谢支持! 附上汇总贴:5G无线技术基础自学系列 | 汇总_COCOgsta的博客-CSDN博客 在LTE协议中,DCI的位置和对应…