EDM: Efficient Deep Feature Matching
作者: Xi Li, Tong Rao, Cihui Pan
分类: cs.CV
发布日期: 2025-03-07 (更新: 2025-05-22)
期刊: https://openaccess.thecvf.com/content/ICCV2025/papers/Li_EDM_Efficient_Deep_Feature_Matching_ICCV_2025_paper.pdf
🔗 代码/项目: GITHUB
💡 一句话要点
提出EDM:一种高效深度特征匹配网络,兼顾精度与效率。
🎯 匹配领域: 支柱六:视频提取与匹配 (Video Extraction)
关键词: 特征匹配 深度学习 计算机视觉 高效算法 图像处理
📋 核心要点
- 现有特征匹配方法缺乏效率考虑,难以满足实际应用需求。
- EDM通过相关性注入模块和轻量级回归头,在保证精度的同时显著提升匹配速度。
- 实验表明,EDM在多个数据集上取得了有竞争力的精度,并展现出卓越的效率。
📝 摘要(中文)
本文重新审视了主流的无检测器特征匹配流程,并在精度和效率方面对其所有阶段进行了改进。我们提出了一种高效的深度特征匹配网络EDM。首先,我们采用具有更少维度但更深层的CNN来提取多层次特征。然后,我们提出了相关性注入模块,该模块对高层深度特征进行特征转换,并逐步注入从全局到局部的特征相关性,以实现高效的多尺度特征聚合,从而提高速度和性能。在细化阶段,设计了一种新颖的轻量级双向轴回归头,用于直接从潜在特征预测亚像素级对应关系,避免了在高分辨率局部特征热图上显式定位关键点的巨大计算成本。此外,引入了有效的选择策略来提高匹配精度。大量实验表明,我们的EDM在各种基准测试中实现了具有竞争力的匹配精度,并表现出卓越的效率,为实际应用提供了有价值的最佳实践。
🔬 方法详解
问题定义:现有深度特征匹配方法通常计算复杂度高,难以在资源受限的场景中应用。显式地定位高分辨率特征图上的关键点需要大量的计算资源,限制了匹配速度。因此,如何在保证匹配精度的前提下,降低计算复杂度,提高匹配效率是本文要解决的核心问题。
核心思路:本文的核心思路是通过高效的特征提取、特征聚合和对应关系预测来降低计算复杂度。具体来说,利用更深但维度更少的CNN提取多层次特征,通过相关性注入模块高效聚合多尺度特征,并设计轻量级的回归头直接预测亚像素级别的对应关系,避免了耗时的关键点定位。
技术框架:EDM的整体框架包含三个主要阶段:特征提取、特征聚合和对应关系细化。首先,使用深度CNN提取多层次特征。然后,通过相关性注入模块,从全局到局部逐步注入特征相关性,实现高效的多尺度特征聚合。最后,利用轻量级的双向轴回归头,直接从潜在特征预测亚像素级别的对应关系。
关键创新:EDM的关键创新在于相关性注入模块和轻量级双向轴回归头的设计。相关性注入模块通过逐步注入特征相关性,实现了高效的多尺度特征聚合,避免了直接计算所有尺度特征之间的相关性。轻量级双向轴回归头直接预测亚像素级别的对应关系,避免了在高分辨率特征图上显式定位关键点的计算开销。
关键设计:在特征提取阶段,使用了更深但维度更少的CNN,以提高特征的表达能力,同时降低计算复杂度。相关性注入模块通过多个卷积层和非线性激活函数实现特征转换和相关性注入。双向轴回归头通过两个独立的轴向回归分支,分别预测水平和垂直方向的偏移量,从而实现亚像素级别的对应关系预测。损失函数包括匹配损失和回归损失,用于优化特征匹配和对应关系预测。
🖼️ 关键图片
📊 实验亮点
EDM在多个基准测试中取得了具有竞争力的匹配精度,同时展现出卓越的效率。例如,在某数据集上,EDM的匹配精度与现有方法相当,但运行速度提升了X倍(具体数据请参考原论文)。实验结果表明,EDM在精度和效率之间取得了良好的平衡,为实际应用提供了有价值的参考。
🎯 应用场景
EDM具有广泛的应用前景,例如在机器人导航、增强现实、图像拼接、三维重建等领域。其高效的特征匹配能力可以支持实时性要求较高的应用,例如移动端的增强现实应用。此外,EDM还可以应用于图像检索、目标识别等领域,提高相关任务的性能。
📄 摘要(原文)
Recent feature matching methods have achieved remarkable performance but lack efficiency consideration. In this paper, we revisit the mainstream detector-free matching pipeline and improve all its stages considering both accuracy and efficiency. We propose an Efficient Deep feature Matching network, EDM. We first adopt a deeper CNN with fewer dimensions to extract multi-level features. Then we present a Correlation Injection Module that conducts feature transformation on high-level deep features, and progressively injects feature correlations from global to local for efficient multi-scale feature aggregation, improving both speed and performance. In the refinement stage, a novel lightweight bidirectional axis-based regression head is designed to directly predict subpixel-level correspondences from latent features, avoiding the significant computational cost of explicitly locating keypoints on high-resolution local feature heatmaps. Moreover, effective selection strategies are introduced to enhance matching accuracy. Extensive experiments show that our EDM achieves competitive matching accuracy on various benchmarks and exhibits excellent efficiency, offering valuable best practices for real-world applications. The code is available at https://github.com/chicleee/EDM.