RGS-SLAM: Robust Gaussian Splatting SLAM with One-Shot Dense Initialization

作者: Wei-Tse Cheng, Yen-Jen Chiou, Yuan-Fu Yang

分类: cs.CV, cs.RO

发布日期: 2025-12-28 (更新: 2026-01-15)

备注: 10 pages, 9 figures

🔗 代码/项目: PROJECT_PAGE

💡 一句话要点

RGS-SLAM：基于高斯溅射和单次密集初始化的鲁棒SLAM

🎯 匹配领域: 支柱三：空间感知与语义 (Perception & Semantics)

关键词: SLAM 高斯溅射 三维重建 DINOv3 密集初始化

📋 核心要点

传统GS-SLAM依赖残差驱动的密集化，导致早期映射不稳定和收敛速度慢，尤其是在复杂场景中。
RGS-SLAM通过DINOv3特征和置信度加权三角化，实现一次性的密集高斯初始化，避免了渐进式添加高斯函数的需要。
实验表明，RGS-SLAM在定位精度、重建质量和收敛速度上均优于现有方法，并在实时性方面表现出色。

📝 摘要（中文）

RGS-SLAM是一个鲁棒的高斯溅射SLAM框架，它用一种免训练的对应关系到高斯初始化方法取代了GS-SLAM中基于残差的密集化阶段。RGS-SLAM不是逐步添加高斯函数来弥补残差揭示的缺失几何信息，而是对从DINOv3描述符导出的密集多视图对应关系进行单次三角化，并通过置信度感知的内点分类器进行细化，从而在优化之前生成一个分布良好且结构感知的高斯种子。这种初始化稳定了早期映射并加速了大约20%的收敛速度，从而在纹理丰富和杂乱的场景中产生更高的渲染保真度，同时与现有的GS-SLAM流程完全兼容。在TUM RGB-D和Replica数据集上的评估表明，RGS-SLAM与最先进的高斯和基于点的SLAM系统相比，实现了有竞争力或更优越的定位和重建精度，并保持了高达925 FPS的实时映射性能。

🔬 方法详解

问题定义：现有GS-SLAM方法在初始化阶段依赖于残差驱动的密集化，即通过观察到的残差逐步添加高斯基元。这种方法在早期阶段容易受到噪声和不准确几何信息的影响，导致映射不稳定，收敛速度慢，尤其是在纹理丰富和杂乱的场景中。因此，需要一种更鲁棒和高效的初始化方法来加速SLAM过程并提高重建质量。

核心思路：RGS-SLAM的核心思路是用一种单次（one-shot）的密集高斯初始化方法取代GS-SLAM的残差驱动密集化。该方法利用预训练的DINOv3特征提取器提取图像特征，并通过多视图几何约束进行三角化，生成初始的高斯基元。这种方法能够一次性地生成一个分布良好且结构感知的高斯种子，从而避免了渐进式添加高斯基元带来的问题。

技术框架：RGS-SLAM的整体框架可以分为以下几个主要阶段：1) 特征提取：使用DINOv3提取多视角的图像特征。2) 对应关系建立：基于DINOv3特征建立多视角的对应关系。3) 三角化：利用多视角的对应关系进行三角化，生成初始的三维点云。4) 高斯初始化：将三维点云转换为高斯基元，并进行初始化。5) 优化：使用SLAM后端对高斯基元进行优化，得到最终的地图。

关键创新：RGS-SLAM的关键创新在于使用单次密集初始化取代了残差驱动的密集化。与现有方法相比，RGS-SLAM能够更快速、更鲁棒地初始化高斯基元，从而加速SLAM过程并提高重建质量。此外，RGS-SLAM还引入了一个置信度感知的内点分类器，用于过滤掉不准确的对应关系，进一步提高了初始化的鲁棒性。

关键设计：RGS-SLAM的关键设计包括：1) 使用DINOv3作为特征提取器，因为它能够提供鲁棒的图像特征。2) 使用置信度感知的内点分类器来过滤掉不准确的对应关系。3) 使用多视图几何约束进行三角化，以生成准确的三维点云。4) 将三维点云转换为高斯基元时，使用合理的参数设置，例如高斯基元的方差和颜色。

🖼️ 关键图片

📊 实验亮点

RGS-SLAM在TUM RGB-D和Replica数据集上进行了评估，结果表明，RGS-SLAM在定位精度和重建质量上均优于或与最先进的SLAM系统相当。与GS-SLAM相比，RGS-SLAM能够加速约20%的收敛速度，并在纹理丰富和杂乱的场景中产生更高的渲染保真度。此外，RGS-SLAM还实现了高达925 FPS的实时映射性能。

🎯 应用场景

RGS-SLAM具有广泛的应用前景，例如增强现实、虚拟现实、机器人导航、三维重建等。该方法能够快速、鲁棒地构建高质量的三维地图，为这些应用提供可靠的环境感知能力。尤其在纹理复杂、光照变化剧烈的场景下，RGS-SLAM的优势更加明显。未来，RGS-SLAM有望成为下一代SLAM系统的核心组成部分。

📄 摘要（原文）

We introduce RGS-SLAM, a robust Gaussian-splatting SLAM framework that replaces the residual-driven densification stage of GS-SLAM with a training-free correspondence-to-Gaussian initialization. Instead of progressively adding Gaussians as residuals reveal missing geometry, RGS-SLAM performs a one-shot triangulation of dense multi-view correspondences derived from DINOv3 descriptors refined through a confidence-aware inlier classifier, generating a well-distributed and structure-aware Gaussian seed prior to optimization. This initialization stabilizes early mapping and accelerates convergence by roughly 20\%, yielding higher rendering fidelity in texture-rich and cluttered scenes while remaining fully compatible with existing GS-SLAM pipelines. Evaluated on the TUM RGB-D and Replica datasets, RGS-SLAM achieves competitive or superior localization and reconstruction accuracy compared with state-of-the-art Gaussian and point-based SLAM systems, sustaining real-time mapping performance at up to 925 FPS. Additional details and resources are available at this URL: https://breeze1124.github.io/rgs-slam-project-page/

RGS-SLAM: Robust Gaussian Splatting SLAM with One-Shot Dense Initialization

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理