FastTrack: GPU-Accelerated Tracking for Visual SLAM

📄 arXiv: 2509.10757v1 📥 PDF

作者: Kimia Khabiri, Parsa Hosseininejad, Shishir Gopinath, Karthik Dantu, Steven Y. Ko

分类: cs.RO, cs.DC

发布日期: 2025-09-13

备注: Accepted for presentation at IROS 2025, preprint


💡 一句话要点

FastTrack:利用GPU加速视觉SLAM的跟踪模块,提升定位性能。

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics) 支柱六:视频提取与匹配 (Video Extraction)

关键词: 视觉SLAM GPU加速 特征匹配 局部地图跟踪 CUDA 实时性 ORB-SLAM3

📋 核心要点

  1. 视觉SLAM跟踪模块的计算瓶颈在于特征匹配和局部地图跟踪,导致实时性受限。
  2. 利用GPU并行计算能力,加速ORB-SLAM3中耗时的立体特征匹配和局部地图跟踪。
  3. 实验结果表明,在EuRoC和TUM-VI数据集上,立体惯性模式下跟踪性能提升高达2.8倍。

📝 摘要(中文)

视觉惯性SLAM系统的跟踪模块处理输入的图像帧和IMU数据,以估计帧相对于地图的位置。跟踪模块必须及时完成每一帧的处理,以避免定位不佳或跟踪丢失。因此,本文提出了一种新方法,利用GPU计算能力来加速跟踪中耗时的组件,从而提高其性能。这些组件包括立体特征匹配和局部地图跟踪。我们在ORB-SLAM3跟踪过程中使用CUDA实现了我们的设计。评估表明,在使用著名的SLAM数据集EuRoC和TUM-VI时,在立体惯性模式下,桌面和Jetson Xavier NX板上的跟踪性能总体提高了高达2.8倍。

🔬 方法详解

问题定义:视觉SLAM中的跟踪模块需要实时处理图像和IMU数据以估计相机位姿。然而,特征匹配和局部地图跟踪等步骤计算量大,成为系统瓶颈,尤其是在资源受限的平台上。现有方法难以充分利用硬件加速能力,导致跟踪速度慢,影响SLAM系统的整体性能。

核心思路:论文的核心思路是利用GPU的并行计算能力来加速视觉SLAM跟踪模块中的计算密集型任务。通过将特征匹配和局部地图跟踪等步骤移植到GPU上执行,可以显著减少处理时间,提高跟踪速度,从而提升SLAM系统的实时性和鲁棒性。

技术框架:该方法在ORB-SLAM3框架内实现,主要针对跟踪线程进行优化。首先,将立体图像的特征提取和匹配过程移植到GPU上,利用CUDA进行并行加速。其次,局部地图跟踪过程中的关键帧搜索和位姿优化也利用GPU进行加速。整个流程保持了ORB-SLAM3的整体架构,只是将计算密集的部分转移到GPU上。

关键创新:该方法最重要的创新在于将GPU加速应用于视觉SLAM跟踪模块中的多个关键步骤,包括立体特征匹配和局部地图跟踪。与以往主要关注前端或后端优化的方法不同,该方法直接针对跟踪模块的计算瓶颈进行优化,从而实现了显著的性能提升。

关键设计:论文使用CUDA编程模型,针对GPU的架构特点对算法进行了优化。例如,在特征匹配过程中,采用了并行化的暴力匹配算法,并利用共享内存来减少数据传输。在局部地图跟踪中,关键帧搜索和位姿优化也采用了并行化的算法,并针对GPU的内存访问模式进行了优化。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,在EuRoC和TUM-VI数据集上,该方法在立体惯性模式下,桌面和Jetson Xavier NX板上的跟踪性能总体提高了高达2.8倍。这表明该方法能够有效地利用GPU加速来提升视觉SLAM系统的跟踪性能,尤其是在嵌入式平台上具有显著优势。

🎯 应用场景

该研究成果可广泛应用于机器人导航、增强现实、无人机等领域。通过提高视觉SLAM系统的跟踪速度和鲁棒性,可以使这些应用在资源受限的平台上也能实现高性能的定位和建图。未来的发展方向包括进一步优化GPU加速算法,以及将其应用于更复杂的SLAM系统。

📄 摘要(原文)

The tracking module of a visual-inertial SLAM system processes incoming image frames and IMU data to estimate the position of the frame in relation to the map. It is important for the tracking to complete in a timely manner for each frame to avoid poor localization or tracking loss. We therefore present a new approach which leverages GPU computing power to accelerate time-consuming components of tracking in order to improve its performance. These components include stereo feature matching and local map tracking. We implement our design inside the ORB-SLAM3 tracking process using CUDA. Our evaluation demonstrates an overall improvement in tracking performance of up to 2.8x on a desktop and Jetson Xavier NX board in stereo-inertial mode, using the well-known SLAM datasets EuRoC and TUM-VI.