VarSplat: Uncertainty-aware 3D Gaussian Splatting for Robust RGB-D SLAM

📄 arXiv: 2603.09673v1 📥 PDF

作者: Anh Thuan Tran, Jana Kosecka

分类: cs.CV

发布日期: 2026-03-10

备注: Accepted to CVPR 2026


💡 一句话要点

VarSplat:面向RGB-D SLAM的、不确定性感知的鲁棒3D高斯溅射

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 3D高斯溅射 SLAM 不确定性感知 RGB-D SLAM 鲁棒性 位姿估计 三维重建

📋 核心要点

  1. 现有3DGS-SLAM方法隐式处理测量可靠性,导致在低纹理区域易发生漂移,影响位姿估计和全局对齐。
  2. VarSplat显式学习每个splat的外观方差,并渲染逐像素不确定性图,引导系统关注可靠区域。
  3. 实验表明,VarSplat在多个数据集上提升了RGB-D SLAM的鲁棒性,并在跟踪、建图和渲染方面表现优异。

📝 摘要(中文)

本文提出VarSplat,一个不确定性感知的3D高斯溅射(3DGS)SLAM系统,旨在提高在低纹理区域、透明表面或具有复杂反射特性的区域的鲁棒性。VarSplat显式地学习每个splat的外观方差,并通过全方差定律与alpha合成,以高效的单程光栅化渲染可微的逐像素不确定性图。该图指导跟踪、子图注册和回环检测,使其关注可靠区域,从而实现更稳定的优化。在Replica(合成)以及TUM-RGBD、ScanNet和ScanNet++(真实世界)数据集上的实验结果表明,VarSplat提高了鲁棒性,并在密集RGB-D SLAM的跟踪、建图和新视角合成渲染方面达到了具有竞争力的或更优越的性能。

🔬 方法详解

问题定义:现有的基于3D高斯溅射的SLAM方法在处理测量噪声和不确定性方面存在不足。尤其是在低纹理、透明或具有复杂反射特性的区域,由于缺乏可靠的几何或外观信息,容易导致位姿估计漂移和地图质量下降。这些方法通常隐式地处理测量可靠性,无法有效地利用不确定性信息来指导优化过程。

核心思路:VarSplat的核心思路是显式地建模每个3D高斯splat的外观方差,并利用这些方差信息来推导逐像素的不确定性图。通过将不确定性信息融入到跟踪、子图注册和回环检测等模块中,引导系统更加关注可靠的区域,从而提高SLAM系统的鲁棒性和精度。这样设计的目的是为了在信息不足的区域降低不可靠信息的影响,同时充分利用可靠信息进行优化。

技术框架:VarSplat系统的整体框架包括以下几个主要模块:1) 3D高斯splat表示:使用3D高斯splat来表示场景几何和外观信息,每个splat包含位置、协方差、颜色和不透明度等参数。2) 外观方差估计:显式地学习每个splat的外观方差,用于表示该splat外观信息的不确定性。3) 不确定性渲染:通过全方差定律和alpha合成,将splat的外观方差转换为逐像素的不确定性图。4) 跟踪与优化:利用不确定性图来指导跟踪过程,并将其融入到位姿优化和地图优化中。5) 回环检测:使用不确定性信息来提高回环检测的准确性和鲁棒性。

关键创新:VarSplat的关键创新在于显式地建模和利用3D高斯splat的外观方差。与现有方法相比,VarSplat能够更准确地表示场景中的不确定性,并将其有效地融入到SLAM系统的各个模块中。通过可微的逐像素不确定性图,VarSplat能够引导系统关注可靠区域,从而提高在复杂环境下的鲁棒性和精度。

关键设计:VarSplat的关键设计包括:1) 使用全方差定律来推导逐像素不确定性图,确保不确定性估计的准确性。2) 设计损失函数,将不确定性信息融入到位姿优化和地图优化中,引导系统更加关注可靠区域。3) 使用高效的单程光栅化算法来渲染不确定性图,保证系统的实时性。具体参数设置和网络结构细节未在摘要中体现,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

VarSplat在Replica、TUM-RGBD、ScanNet和ScanNet++等数据集上进行了评估。实验结果表明,VarSplat在跟踪、建图和新视角合成渲染方面均取得了显著的提升,在多个数据集上达到了state-of-the-art的性能。具体的性能数据和提升幅度未在摘要中体现,属于未知信息。

🎯 应用场景

VarSplat具有广泛的应用前景,包括增强现实、虚拟现实、机器人导航、三维重建等领域。通过提高SLAM系统在复杂环境下的鲁棒性和精度,VarSplat可以为这些应用提供更可靠的环境感知能力。例如,在机器人导航中,VarSplat可以帮助机器人在低纹理或光照变化剧烈的环境中更准确地定位和建图,从而实现更安全和高效的导航。

📄 摘要(原文)

Simultaneous Localization and Mapping (SLAM) with 3D Gaussian Splatting (3DGS) enables fast, differentiable rendering and high-fidelity reconstruction across diverse real-world scenes. However, existing 3DGS-SLAM approaches handle measurement reliability implicitly, making pose estimation and global alignment susceptible to drift in low-texture regions, transparent surfaces, or areas with complex reflectance properties. To this end, we introduce VarSplat, an uncertainty-aware 3DGS-SLAM system that explicitly learns per-splat appearance variance. By using the law of total variance with alpha compositing, we then render differentiable per-pixel uncertainty map via efficient, single-pass rasterization. This map guides tracking, submap registration, and loop detection toward focusing on reliable regions and contributes to more stable optimization. Experimental results on Replica (synthetic) and TUM-RGBD, ScanNet, and ScanNet++ (real-world) show that VarSplat improves robustness and achieves competitive or superior tracking, mapping, and novel view synthesis rendering compared to existing studies for dense RGB-D SLAM.