Outdoor Monocular SLAM with Global Scale-Consistent 3D Gaussian Pointmaps

📄 arXiv: 2507.03737v2 📥 PDF

作者: Chong Cheng, Sicheng Yu, Zijian Wang, Yifan Zhou, Hao Wang

分类: cs.CV

发布日期: 2025-07-04 (更新: 2025-07-24)

备注: Accepted by ICCV2025

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

S3PO-GS:基于全局尺度一致3D高斯点图的室外单目SLAM

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 单目SLAM 3D高斯溅射 室外场景 尺度一致性 几何先验 自洽跟踪 点云地图

📋 核心要点

  1. 现有3DGS SLAM方法在室外场景中缺乏几何先验,且易因相机运动累积误差,导致尺度漂移。
  2. S3PO-GS通过自洽跟踪模块和基于图像块的点图动态映射模块,引入几何先验并避免尺度漂移。
  3. 实验结果表明,S3PO-GS在novel view synthesis和跟踪精度上均优于现有3DGS SLAM方法。

📝 摘要(中文)

本文提出了一种鲁棒的仅使用RGB图像的室外3D高斯溅射(3DGS)SLAM方法:S3PO-GS。针对现有3DGS SLAM方法在室外场景中缺乏几何先验以及累积误差导致尺度漂移的问题,S3PO-GS建立了一个锚定于3DGS点图的自洽跟踪模块,避免了累积尺度漂移,并以更少的迭代次数实现了更精确和鲁棒的跟踪。此外,设计了一个基于图像块的点图动态映射模块,引入了几何先验,同时避免了尺度模糊。这显著提高了跟踪精度和场景重建质量,使其特别适用于复杂的室外环境。在Waymo、KITTI和DL3DV数据集上的实验表明,S3PO-GS在novel view synthesis方面取得了state-of-the-art的结果,并且在跟踪精度方面优于其他3DGS SLAM方法。

🔬 方法详解

问题定义:现有基于3D高斯溅射(3DGS)的SLAM方法在室外场景中面临挑战。一些方法依赖于可微渲染管线进行跟踪,缺乏几何先验,导致在复杂环境中表现不佳。另一些方法引入了独立的跟踪模块,但随着相机运动,误差会累积,导致尺度漂移,影响重建质量和定位精度。

核心思路:S3PO-GS的核心思路是建立一个自洽的跟踪模块,该模块直接锚定在3DGS点图上,从而避免了累积的尺度漂移。同时,引入基于图像块的点图动态映射模块,利用图像块的几何信息作为先验,在优化过程中约束点图的尺度,提高跟踪的鲁棒性和精度。

技术框架:S3PO-GS的整体框架包含两个主要模块:自洽跟踪模块和点图动态映射模块。自洽跟踪模块负责估计相机的位姿,它通过最小化渲染图像与观测图像之间的差异来实现。点图动态映射模块则负责更新3DGS点图,它基于图像块的几何信息来调整点的位置和尺度,从而提高点图的精度和一致性。这两个模块相互作用,共同完成SLAM任务。

关键创新:S3PO-GS的关键创新在于其自洽跟踪模块和基于图像块的点图动态映射模块的结合。自洽跟踪模块避免了传统方法中因误差累积导致的尺度漂移问题,而基于图像块的点图动态映射模块则引入了几何先验,提高了点图的精度和鲁棒性。这种结合使得S3PO-GS在复杂的室外环境中能够实现更精确和鲁棒的SLAM。

关键设计:在自洽跟踪模块中,使用了基于高斯牛顿法的优化算法来最小化渲染误差。在点图动态映射模块中,图像块的大小和数量是关键参数,需要根据场景的复杂度和计算资源进行调整。损失函数的设计也至关重要,它需要平衡渲染误差和几何先验之间的权重,以获得最佳的重建效果。具体参数设置细节未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

S3PO-GS在Waymo、KITTI和DL3DV数据集上进行了评估,实验结果表明,S3PO-GS在novel view synthesis方面取得了state-of-the-art的结果,并且在跟踪精度方面优于其他3DGS SLAM方法。具体性能提升数据未知,但论文强调了其在复杂室外环境下的优越性。

🎯 应用场景

S3PO-GS在自动驾驶、增强现实、机器人导航等领域具有广泛的应用前景。它可以用于构建高精度的室外场景地图,为自动驾驶车辆提供可靠的定位和导航信息。此外,它还可以用于增强现实应用中,将虚拟物体与真实场景进行精确的融合。在机器人导航领域,S3PO-GS可以帮助机器人更好地理解周围环境,从而实现更智能的自主导航。

📄 摘要(原文)

3D Gaussian Splatting (3DGS) has become a popular solution in SLAM due to its high-fidelity and real-time novel view synthesis performance. However, some previous 3DGS SLAM methods employ a differentiable rendering pipeline for tracking, lack geometric priors in outdoor scenes. Other approaches introduce separate tracking modules, but they accumulate errors with significant camera movement, leading to scale drift. To address these challenges, we propose a robust RGB-only outdoor 3DGS SLAM method: S3PO-GS. Technically, we establish a self-consistent tracking module anchored in the 3DGS pointmap, which avoids cumulative scale drift and achieves more precise and robust tracking with fewer iterations. Additionally, we design a patch-based pointmap dynamic mapping module, which introduces geometric priors while avoiding scale ambiguity. This significantly enhances tracking accuracy and the quality of scene reconstruction, making it particularly suitable for complex outdoor environments. Our experiments on the Waymo, KITTI, and DL3DV datasets demonstrate that S3PO-GS achieves state-of-the-art results in novel view synthesis and outperforms other 3DGS SLAM methods in tracking accuracy. Project page: https://3dagentworld.github.io/S3PO-GS/.