1、DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF Relocalization
论文链接
代码链接
这是一篇训练点云的文章,在训练出local descriptor之后,通过聚类的方法得出global descriptor,并且提出了hierarchical network,使得local descriptor和global descriptor可以通过一个网络得到,通过共享计算降低了网络的复杂度,从而加快计算和训练。
2、RoRD: Rotation-Robust Descriptors and Orthographic Views for Local Feature Matching
论文链接
代码链接(未完成)
使用VGG作为主干网络,然后一半使用D2-net,另一半使用RoRD网络,RoRD网络会给原始图片一个较大的旋转,以提高所训练出的描述子的旋转不变性,D2-net可以保证在旋转较小或者没有旋转的时候,描述子依然可以很好地进行匹配。然后整合两种描述子。
3、DF-SLAM: A Deep-Learning Enhanced Visual SLAM System based on Deep Local Features
论文链接
未找到相关代码
主要思想:Tfeat(论文链接、代码链接)结构+Hardnet(论文链接)提出的negative mining strategy
loss function:
采样策略通过L2成对距离矩阵在批次中选择最接近的不匹配patch。首先是生成一堆匹配好的局部patch,对一块patch中的指定anchor,只能一个可以匹配的patch。定义距离矩阵
D
=
d
i
j
D={d_{ij}}
D=dij.表示第
i
i
i个anchor patch描述子到第
j
j
j个postive patch描述子。
从而,hardest negative patch distance可以通过下式进行计算:
d
n
=
m
i
n
(
a
k
m
i
n
,
p
j
m
i
n
)
d_n=min(a_{k_{min}},p_{j_{min}})
dn=min(akmin,pjmin)
这里,
a
k
m
i
n
a_{k_{min}}
akmin表示到anchor patch最近的patch,
p
j
m
i
n
p_{j_{min}}
pjmin表示到positive patch最近的patch。
从而定义损失函数:
这里,
a
i
a_i
ai表示anchor描述子,
p
i
p_i
pi是positive描述子。
4、Scale-Adaptive Neural Dense Features: Learning via Hierarchical Context Aggregation
Pixel-wise Contrastive Loss: