GSORB-SLAM: Gaussian Splatting SLAM benefits from ORB features and Transmittance information

📄 arXiv: 2410.11356v3 📥 PDF

作者: Wancai Zheng, Xinyi Yu, Jintao Rong, Linlin Ou, Yan Wei, Libo Zhou

分类: cs.RO

发布日期: 2024-10-15 (更新: 2025-02-22)

期刊: RAL 2025

DOI: 10.1109/LRA.2025.3592066

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

GSORB-SLAM:融合ORB特征与透射率信息的3D高斯溅射SLAM,提升跟踪精度与重建质量。

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: SLAM 3D高斯溅射 ORB特征 稠密重建 几何优化 视点选择 机器人导航

📋 核心要点

  1. 现有3DGS SLAM方法对伪影和噪声敏感,训练视点选择不佳,缺乏全局优化。
  2. GSORB-SLAM通过紧耦合ORB特征与3DGS,并引入几何表示优化、自适应高斯扩展和混合视点选择机制来解决上述问题。
  3. 实验结果表明,GSORB-SLAM在跟踪精度和重建质量上均优于现有方法,RMSE降低16.2%,PSNR提升3.93dB。

📝 摘要(中文)

本文提出GSORB-SLAM,一个紧耦合的稠密SLAM框架,它将3D高斯溅射(3DGS)与ORB特征相结合。为了减轻噪声和伪影的影响,我们提出了一种新的几何表示和优化方法用于跟踪,显著提高了定位精度和鲁棒性。为了实现高保真度的地图构建,我们开发了一种自适应高斯扩展和正则化方法,该方法有助于紧凑而富有表现力的场景建模,同时抑制冗余的图元。此外,我们设计了一种混合的基于图的视点选择机制,有效地减少了过拟合并加速了收敛。在各种数据集上的大量评估表明,我们的系统在跟踪精度(相比ORB-SLAM2基线,RMSE提高了16.2%)和重建质量(相比3DGS-SLAM基线,PSNR提高了3.93 dB)方面都达到了最先进的性能。

🔬 方法详解

问题定义:现有的基于3D高斯溅射的SLAM方法在实际应用中面临着一些挑战。首先,它们对场景中的伪影和噪声非常敏感,这会导致跟踪精度下降和地图构建质量降低。其次,训练视点的选择策略不够优化,容易导致过拟合和收敛速度慢。最后,缺乏有效的全局优化机制,难以保证地图的一致性和准确性。

核心思路:GSORB-SLAM的核心思路是将传统的ORB特征与3D高斯溅射相结合,利用ORB特征的鲁棒性来提高跟踪的精度和鲁棒性,同时利用3D高斯溅射的表达能力来构建高质量的稠密地图。此外,通过引入几何表示优化、自适应高斯扩展和混合视点选择机制,进一步提升系统的性能。这样设计的目的是为了克服现有方法的不足,实现更准确、更鲁棒、更高效的SLAM系统。

技术框架:GSORB-SLAM的整体框架包含以下几个主要模块:1) ORB特征提取与匹配:提取图像中的ORB特征,并与地图中的ORB特征进行匹配,用于位姿估计。2) 3D高斯溅射表示:使用3D高斯溅射来表示场景的几何和外观信息。3) 跟踪模块:利用ORB特征匹配和几何表示优化,估计相机的位姿。4) 地图构建模块:通过自适应高斯扩展和正则化,构建高质量的稠密地图。5) 全局优化模块:利用混合视点选择机制,进行全局优化,提高地图的一致性和准确性。

关键创新:GSORB-SLAM的关键创新点在于以下几个方面:1) 提出了新的几何表示和优化方法,用于提高跟踪的精度和鲁棒性。2) 开发了一种自适应高斯扩展和正则化方法,用于构建紧凑而富有表现力的场景模型。3) 设计了一种混合的基于图的视点选择机制,用于减少过拟合和加速收敛。这些创新点使得GSORB-SLAM在跟踪精度和重建质量方面都优于现有方法。

关键设计:在几何表示优化方面,论文可能设计了一种新的损失函数,用于约束高斯分布的形状和位置,使其更好地拟合场景的几何结构。在自适应高斯扩展方面,论文可能根据场景的复杂度动态调整高斯分布的数量和大小。在混合视点选择机制方面,论文可能结合了基于信息增益和基于覆盖率的视点选择策略,以实现更好的全局优化效果。具体的参数设置、损失函数和网络结构等技术细节需要在论文中进一步查找。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

GSORB-SLAM在多个数据集上进行了广泛的评估,实验结果表明,该系统在跟踪精度和重建质量方面均优于现有方法。具体而言,相比ORB-SLAM2基线,GSORB-SLAM的RMSE降低了16.2%。相比3DGS-SLAM基线,GSORB-SLAM的PSNR提高了3.93 dB。这些数据表明,GSORB-SLAM在性能上具有显著的优势。

🎯 应用场景

GSORB-SLAM具有广泛的应用前景,包括增强现实、虚拟现实、机器人导航、三维重建等领域。该技术可以用于构建高精度、高鲁棒性的环境地图,为机器人提供可靠的定位和导航信息,也可以用于创建逼真的虚拟场景,提升用户体验。未来,该技术有望应用于自动驾驶、智能家居、工业自动化等领域。

📄 摘要(原文)

The emergence of 3D Gaussian Splatting (3DGS) has recently ignited a renewed wave of research in dense visual SLAM. However, existing approaches encounter challenges, including sensitivity to artifacts and noise, suboptimal selection of training viewpoints, and the absence of global optimization. In this paper, we propose GSORB-SLAM, a dense SLAM framework that integrates 3DGS with ORB features through a tightly coupled optimization pipeline. To mitigate the effects of noise and artifacts, we propose a novel geometric representation and optimization method for tracking, which significantly enhances localization accuracy and robustness. For high-fidelity mapping, we develop an adaptive Gaussian expansion and regularization method that facilitates compact yet expressive scene modeling while suppressing redundant primitives. Furthermore, we design a hybrid graph-based viewpoint selection mechanism that effectively reduces overfitting and accelerates convergence. Extensive evaluations across various datasets demonstrate that our system achieves state-of-the-art performance in both tracking precision-improving RMSE by 16.2% compared to ORB-SLAM2 baselines-and reconstruction quality-improving PSNR by 3.93 dB compared to 3DGS-SLAM baselines. The project: https://aczheng-cai.github.io/gsorb-slam.github.io/