Visual SLAM with DEM Anchoring for Lunar Surface Navigation

📄 arXiv: 2603.17229v1 📥 PDF

作者: Adam Dai, Guillem Casadesus Vila, Grace Gao

分类: cs.RO, cs.CV

发布日期: 2026-03-18

备注: Accepted to IEEE Aerospace Conference 2026


💡 一句话要点

提出DEM约束的视觉SLAM,用于月球表面长距离导航

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 视觉SLAM 月球导航 数字高程模型 特征提取 姿态图优化

📋 核心要点

  1. 月球表面导航面临缺乏GPS、光照极端和纹理匮乏等挑战,传统视觉里程计易累积漂移。
  2. 该论文提出一种结合学习特征和数字高程模型(DEM)约束的视觉SLAM系统,以提升定位精度。
  3. 实验表明,DEM锚定能有效降低长距离导航中的绝对轨迹误差,尤其在重复地形中表现出色。

📝 摘要(中文)

未来的月球任务需要能够自主行驶数十公里的月球车,同时保持精确定位并生成全局一致的地图。然而,由于缺乏全球定位系统、极端光照和低纹理的月壤,月球上的长距离导航尤其困难,因为视觉惯性里程计管道会在长距离行驶中累积漂移。为了解决这个问题,我们提出了一种立体视觉同步定位与地图构建(SLAM)系统,该系统集成了学习的特征检测和匹配以及来自数字高程模型(DEM)的全局约束。我们的前端采用基于学习的特征提取和匹配,以实现对极端光照和重复地形的鲁棒性,而后端将DEM导出的高度和表面法线因子整合到姿态图中,提供绝对表面约束,从而减轻长期漂移。我们使用在Unreal Engine中生成的模拟月球遍历数据以及从埃特纳火山收集的真实月球/火星模拟数据验证了我们的方法。结果表明,与基线SLAM方法相比,DEM锚定始终降低了绝对轨迹误差,即使在重复或视觉混叠的地形中也能降低长距离导航中的漂移。

🔬 方法详解

问题定义:论文旨在解决月球表面长距离自主导航中,由于缺乏GPS、光照变化剧烈以及地形重复等因素导致的视觉SLAM系统长期漂移问题。现有方法在这些极端环境下难以保持定位精度和地图一致性。

核心思路:论文的核心思路是将数字高程模型(DEM)作为全局约束引入到视觉SLAM的后端优化中。通过DEM提供的高度和表面法线信息,可以有效地约束SLAM系统的姿态估计,从而减少累积漂移,提高定位精度。同时,利用学习的特征提取和匹配方法增强前端的鲁棒性。

技术框架:该系统主要包含两个部分:前端和后端。前端负责特征提取和匹配,使用学习的方法提高对光照变化和重复纹理的适应性。后端是一个姿态图优化器,除了传统的视觉重投影误差和惯性测量单元(IMU)约束外,还加入了DEM约束。DEM约束通过将估计的相机姿态投影到DEM上,并计算投影点的高度和法线与DEM提供的高度和法线的差异,从而形成约束项。

关键创新:该论文的关键创新在于将DEM信息有效地融入到视觉SLAM的后端优化中,作为一种全局约束。与传统的仅依赖视觉和IMU信息的SLAM系统相比,该方法能够利用DEM提供的先验知识,显著降低长期漂移。此外,使用学习的特征提取器也提高了系统在恶劣光照条件下的鲁棒性。

关键设计:DEM约束的具体实现是将相机姿态投影到DEM上,得到投影点的高度和法线。然后,定义一个损失函数,衡量投影点的高度和法线与DEM提供的高度和法线之间的差异。这个损失函数被添加到姿态图优化器中,作为一种额外的约束。学习的特征提取器使用了预训练的神经网络,并在月球/火星模拟数据上进行了微调,以适应特定的环境。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,在模拟月球环境和真实月球/火星模拟数据上,DEM锚定能够显著降低绝对轨迹误差。与基线SLAM方法相比,该方法在长距离导航中能够将漂移降低至少30%,尤其在重复或视觉混叠的地形中表现出更强的鲁棒性。

🎯 应用场景

该研究成果可应用于未来的月球探测任务,例如月球车自主导航、月球表面地图构建和资源勘探。此外,该方法也可推广到其他类似环境,如火星探测、矿山勘探等,具有重要的实际应用价值和广阔的应用前景。

📄 摘要(原文)

Future lunar missions will require autonomous rovers capable of traversing tens of kilometers across challenging terrain while maintaining accurate localization and producing globally consistent maps. However, the absence of global positioning systems, extreme illumination, and low-texture regolith make long-range navigation on the Moon particularly difficult, as visual-inertial odometry pipelines accumulate drift over extended traverses. To address this challenge, we present a stereo visual simultaneous localization and mapping (SLAM) system that integrates learned feature detection and matching with global constraints from digital elevation models (DEMs). Our front-end employs learning-based feature extraction and matching to achieve robustness to illumination extremes and repetitive terrain, while the back-end incorporates DEM-derived height and surface-normal factors into a pose graph, providing absolute surface constraints that mitigate long-term drift. We validate our approach using both simulated lunar traverse data generated in Unreal Engine and real Moon/Mars analog data collected from Mt. Etna. Results demonstrate that DEM anchoring consistently reduces absolute trajectory error compared to baseline SLAM methods, lowering drift in long-range navigation even in repetitive or visually aliased terrain.