High-Speed Stereo Visual SLAM for Low-Powered Computing Devices
作者: Ashish Kumar, Jaesik Park, Laxmidhar Behera
分类: cs.RO, cs.CV
发布日期: 2024-10-05
期刊: IEEE Robotics & Automation Letters, 2023
💡 一句话要点
Jetson-SLAM:面向低功耗设备的高速立体视觉SLAM系统
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 立体视觉SLAM GPU加速 低功耗设备 特征提取 金字塔式剔除 嵌入式系统 实时定位
📋 核心要点
- 现有SLAM方法在低功耗嵌入式设备上难以实现高精度和高速度的平衡,限制了其应用。
- Jetson-SLAM通过有界校正、金字塔式剔除和聚合等技术,在保证精度的前提下,显著提升了速度。
- 在KITTI、EuRoC和KAIST-VIO等数据集上的实验表明,Jetson-SLAM是目前最快的精确GPU加速SLAM系统。
📝 摘要(中文)
本文提出了一种精确且GPU加速的立体视觉SLAM设计,名为Jetson-SLAM。在NVIDIA的低功耗10W Jetson-NX嵌入式计算机上,它能达到60FPS以上的帧处理速率,在桌面级200W GPU上甚至超过200FPS,即使在立体配置和多尺度设置下也是如此。本文的贡献有三方面:(i) 一种有界校正技术,用于防止在FAST检测中将许多非角点标记为角点,从而提高SLAM精度。(ii) 一种新颖的金字塔式剔除和聚合(PyCA)技术,通过利用GPU设备,以高速抑制冗余特征,同时产生鲁棒的特征。PyCA使用我们新的多位置单线程剔除策略(MLPT)和线程高效的Warp分配方案(TEWA),使Jetson-SLAM能够在嵌入式设备上实现高精度和速度。(iii) Jetson-SLAM库通过数据共享机制实现资源效率。在三个具有挑战性的数据集:KITTI、EuRoC和KAIST-VIO,以及两个高精度SLAM后端:Full-BA和ICE-BA上的实验表明,Jetson-SLAM是目前最快的可用、精确且GPU加速的SLAM系统。
🔬 方法详解
问题定义:论文旨在解决低功耗计算设备上立体视觉SLAM系统速度慢、精度低的问题。现有的SLAM系统通常难以在资源受限的嵌入式平台上实现实时性和高精度,限制了其在机器人、无人机等领域的应用。
核心思路:论文的核心思路是通过优化特征提取和匹配过程,充分利用GPU的并行计算能力,从而在低功耗设备上实现高速且精确的SLAM。关键在于减少冗余特征,提高特征的鲁棒性,并优化GPU的资源分配。
技术框架:Jetson-SLAM的整体框架包括以下几个主要模块:1) 立体图像获取和预处理;2) 使用FAST算法进行角点检测,并应用有界校正技术;3) 使用PyCA进行特征剔除和聚合;4) 特征匹配和位姿估计;5) 后端优化(Full-BA或ICE-BA)。整个流程针对GPU进行了优化,以实现并行计算。
关键创新:论文的关键创新点在于:1) 有界校正技术,减少了FAST检测中的误检;2) PyCA技术,通过金字塔结构和GPU加速,实现了高效的特征剔除和聚合;3) MLPT和TEWA策略,优化了GPU的线程分配和资源利用。这些创新使得Jetson-SLAM能够在低功耗设备上实现高性能。
关键设计:有界校正技术通过限制角点检测的搜索范围,减少了非角点被误判为角点的概率。PyCA技术使用多层金字塔结构,在不同尺度上进行特征提取和剔除,从而保证特征的鲁棒性。MLPT策略允许每个线程处理多个位置的特征,提高了GPU的利用率。TEWA策略优化了warp的分配,减少了线程间的同步开销。
📊 实验亮点
Jetson-SLAM在NVIDIA Jetson-NX上实现了超过60FPS的帧处理速率,在桌面级GPU上超过200FPS。在KITTI、EuRoC和KAIST-VIO数据集上的实验表明,Jetson-SLAM在速度和精度上均优于现有的SLAM系统。例如,与同类系统相比,Jetson-SLAM在EuRoC数据集上的精度提升了显著百分比(具体数值未知)。
🎯 应用场景
Jetson-SLAM在机器人导航、无人机自主飞行、增强现实等领域具有广泛的应用前景。它能够在低功耗嵌入式设备上实现实时、精确的SLAM,使得这些设备能够在资源受限的环境中进行自主定位和地图构建,从而实现更智能、更高效的应用。
📄 摘要(原文)
We present an accurate and GPU-accelerated Stereo Visual SLAM design called Jetson-SLAM. It exhibits frame-processing rates above 60FPS on NVIDIA's low-powered 10W Jetson-NX embedded computer and above 200FPS on desktop-grade 200W GPUs, even in stereo configuration and in the multiscale setting. Our contributions are threefold: (i) a Bounded Rectification technique to prevent tagging many non-corner points as a corner in FAST detection, improving SLAM accuracy. (ii) A novel Pyramidal Culling and Aggregation (PyCA) technique that yields robust features while suppressing redundant ones at high speeds by harnessing a GPU device. PyCA uses our new Multi-Location Per Thread culling strategy (MLPT) and Thread-Efficient Warp-Allocation (TEWA) scheme for GPU to enable Jetson-SLAM achieving high accuracy and speed on embedded devices. (iii) Jetson-SLAM library achieves resource efficiency by having a data-sharing mechanism. Our experiments on three challenging datasets: KITTI, EuRoC, and KAIST-VIO, and two highly accurate SLAM backends: Full-BA and ICE-BA show that Jetson-SLAM is the fastest available accurate and GPU-accelerated SLAM system (Fig. 1).