High-Speed Stereo Visual SLAM for Low-Powered Computing Devices

作者: Ashish Kumar, Jaesik Park, Laxmidhar Behera

分类: cs.RO, cs.CV

发布日期: 2024-10-05

期刊: IEEE Robotics & Automation Letters, 2023

💡 一句话要点

Jetson-SLAM：面向低功耗设备的高速立体视觉SLAM系统

🎯 匹配领域: 支柱三：空间感知与语义 (Perception & Semantics)

关键词: 立体视觉SLAM GPU加速 低功耗设备 特征提取 金字塔式剔除 嵌入式系统 实时定位

📋 核心要点

现有SLAM方法在低功耗嵌入式设备上难以实现高精度和高速度的平衡，限制了其应用。
Jetson-SLAM通过有界校正、金字塔式剔除和聚合等技术，在保证精度的前提下，显著提升了速度。
在KITTI、EuRoC和KAIST-VIO等数据集上的实验表明，Jetson-SLAM是目前最快的精确GPU加速SLAM系统。

📝 摘要（中文）

本文提出了一种精确且GPU加速的立体视觉SLAM设计，名为Jetson-SLAM。在NVIDIA的低功耗10W Jetson-NX嵌入式计算机上，它能达到60FPS以上的帧处理速率，在桌面级200W GPU上甚至超过200FPS，即使在立体配置和多尺度设置下也是如此。本文的贡献有三方面：(i) 一种有界校正技术，用于防止在FAST检测中将许多非角点标记为角点，从而提高SLAM精度。(ii) 一种新颖的金字塔式剔除和聚合(PyCA)技术，通过利用GPU设备，以高速抑制冗余特征，同时产生鲁棒的特征。PyCA使用我们新的多位置单线程剔除策略(MLPT)和线程高效的Warp分配方案(TEWA)，使Jetson-SLAM能够在嵌入式设备上实现高精度和速度。(iii) Jetson-SLAM库通过数据共享机制实现资源效率。在三个具有挑战性的数据集：KITTI、EuRoC和KAIST-VIO，以及两个高精度SLAM后端：Full-BA和ICE-BA上的实验表明，Jetson-SLAM是目前最快的可用、精确且GPU加速的SLAM系统。

🔬 方法详解

问题定义：论文旨在解决低功耗计算设备上立体视觉SLAM系统速度慢、精度低的问题。现有的SLAM系统通常难以在资源受限的嵌入式平台上实现实时性和高精度，限制了其在机器人、无人机等领域的应用。

核心思路：论文的核心思路是通过优化特征提取和匹配过程，充分利用GPU的并行计算能力，从而在低功耗设备上实现高速且精确的SLAM。关键在于减少冗余特征，提高特征的鲁棒性，并优化GPU的资源分配。

技术框架：Jetson-SLAM的整体框架包括以下几个主要模块：1) 立体图像获取和预处理；2) 使用FAST算法进行角点检测，并应用有界校正技术；3) 使用PyCA进行特征剔除和聚合；4) 特征匹配和位姿估计；5) 后端优化（Full-BA或ICE-BA）。整个流程针对GPU进行了优化，以实现并行计算。

关键创新：论文的关键创新点在于：1) 有界校正技术，减少了FAST检测中的误检；2) PyCA技术，通过金字塔结构和GPU加速，实现了高效的特征剔除和聚合；3) MLPT和TEWA策略，优化了GPU的线程分配和资源利用。这些创新使得Jetson-SLAM能够在低功耗设备上实现高性能。

关键设计：有界校正技术通过限制角点检测的搜索范围，减少了非角点被误判为角点的概率。PyCA技术使用多层金字塔结构，在不同尺度上进行特征提取和剔除，从而保证特征的鲁棒性。MLPT策略允许每个线程处理多个位置的特征，提高了GPU的利用率。TEWA策略优化了warp的分配，减少了线程间的同步开销。

📊 实验亮点

Jetson-SLAM在NVIDIA Jetson-NX上实现了超过60FPS的帧处理速率，在桌面级GPU上超过200FPS。在KITTI、EuRoC和KAIST-VIO数据集上的实验表明，Jetson-SLAM在速度和精度上均优于现有的SLAM系统。例如，与同类系统相比，Jetson-SLAM在EuRoC数据集上的精度提升了显著百分比（具体数值未知）。

🎯 应用场景

Jetson-SLAM在机器人导航、无人机自主飞行、增强现实等领域具有广泛的应用前景。它能够在低功耗嵌入式设备上实现实时、精确的SLAM，使得这些设备能够在资源受限的环境中进行自主定位和地图构建，从而实现更智能、更高效的应用。

📄 摘要（原文）

We present an accurate and GPU-accelerated Stereo Visual SLAM design called Jetson-SLAM. It exhibits frame-processing rates above 60FPS on NVIDIA's low-powered 10W Jetson-NX embedded computer and above 200FPS on desktop-grade 200W GPUs, even in stereo configuration and in the multiscale setting. Our contributions are threefold: (i) a Bounded Rectification technique to prevent tagging many non-corner points as a corner in FAST detection, improving SLAM accuracy. (ii) A novel Pyramidal Culling and Aggregation (PyCA) technique that yields robust features while suppressing redundant ones at high speeds by harnessing a GPU device. PyCA uses our new Multi-Location Per Thread culling strategy (MLPT) and Thread-Efficient Warp-Allocation (TEWA) scheme for GPU to enable Jetson-SLAM achieving high accuracy and speed on embedded devices. (iii) Jetson-SLAM library achieves resource efficiency by having a data-sharing mechanism. Our experiments on three challenging datasets: KITTI, EuRoC, and KAIST-VIO, and two highly accurate SLAM backends: Full-BA and ICE-BA show that Jetson-SLAM is the fastest available accurate and GPU-accelerated SLAM system (Fig. 1).

High-Speed Stereo Visual SLAM for Low-Powered Computing Devices

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理