CompSLAM: Complementary Hierarchical Multi-Modal Localization and Mapping for Robot Autonomy in Underground Environments

📄 arXiv: 2505.06483v1 📥 PDF

作者: Shehryar Khattak, Timon Homberger, Lukas Bernreiter, Julian Nubert, Olov Andersson, Roland Siegwart, Kostas Alexis, Marco Hutter

分类: cs.RO, cs.CV

发布日期: 2025-05-10

备注: 8 pages, 9 figures, Code: https://github.com/leggedrobotics/compslam_subt


💡 一句话要点

CompSLAM:面向地下环境的互补式分层多模态定位与建图

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 多模态融合 定位与建图 地下环境 机器人自主导航 位姿图优化

📋 核心要点

  1. 地下环境机器人自主导航面临光照不足、粉尘干扰和几何结构相似等挑战,传统方法难以保证定位和建图的实时性、鲁棒性和准确性。
  2. CompSLAM利用多种传感器模态的互补性,通过分层架构和冗余信息融合,提高在恶劣环境下的定位和建图的可靠性。
  3. CompSLAM在DARPA地下挑战赛中成功应用,并在后续项目中验证了其有效性,同时公开了数据集和代码,促进了相关研究。

📝 摘要(中文)

本文提出了一种高鲁棒性的分层多模态定位与建图框架CompSLAM,旨在解决未知、无GPS、复杂的地下环境中机器人自主导航的问题。该框架利用多种传感器模态提供的互补位姿估计,通过冗余性实现鲁棒性。CompSLAM在DARPA地下挑战赛中成功部署于Cerberus团队的空中、腿式和轮式机器人上,并助力团队赢得比赛。此外,它还在后续项目中被证明是一种可靠的里程计和建图解决方案,并扩展支持多机器人地图共享,用于袋鼠式机器人部署和协同建图。本文还介绍了一个由四足机器人手动遥操作采集的综合数据集,覆盖了DARPA地下挑战赛决赛赛道的大部分区域。该数据集用于评估CompSLAM在传感器退化情况下的鲁棒性,机器人在几何结构高度可变和光照条件恶劣的环境中行进了740米。CompSLAM代码和DARPA SubT Finals数据集已公开,供机器人社区使用。

🔬 方法详解

问题定义:在未知、无GPS的地下环境中,机器人需要实时、鲁棒和准确的位姿估计和地图构建来实现自主导航。然而,光照不足、粉尘干扰以及几何结构自相似等因素会导致传感器性能下降,使得传统的SLAM方法难以满足要求。现有方法通常依赖单一传感器或简单的融合策略,难以应对复杂多变的地下环境。

核心思路:CompSLAM的核心思路是利用多种传感器模态的互补性,通过分层架构实现鲁棒的定位和建图。不同传感器在不同环境条件下具有不同的优势,例如,激光雷达在几何结构丰富的区域表现良好,而视觉传感器在光照充足的区域表现更好。CompSLAM通过融合这些互补信息,提高系统在各种恶劣环境下的适应性。

技术框架:CompSLAM采用分层架构,包含以下主要模块:1) 多模态传感器数据采集:收集来自激光雷达、视觉传感器、IMU等多种传感器的数据。2) 局部里程计估计:利用各个传感器的数据,独立估计机器人的局部运动。3) 全局位姿图优化:将局部里程计估计结果融合到全局位姿图中,并进行优化,以获得全局一致的位姿估计和地图。4) 地图构建:利用优化后的位姿估计,构建环境地图。

关键创新:CompSLAM的关键创新在于其互补式多模态融合策略和分层架构。与传统的单一传感器或简单融合方法相比,CompSLAM能够充分利用不同传感器的优势,提高系统在恶劣环境下的鲁棒性。分层架构使得系统能够灵活地添加或删除传感器模态,适应不同的机器人平台和环境条件。

关键设计:CompSLAM的关键设计包括:1) 传感器选择和配置:根据具体应用场景选择合适的传感器组合,并进行合理的配置。2) 局部里程计算法:针对不同的传感器,选择合适的里程计算法,例如,激光雷达可以使用ICP或LOAM,视觉传感器可以使用ORB-SLAM或VINS-Mono。3) 位姿图优化:使用g2o或ceres等优化库,对位姿图进行优化,以获得全局一致的位姿估计和地图。4) 鲁棒性评估:设计合理的鲁棒性评估指标,例如,位姿估计误差、地图精度等,用于评估系统在不同环境条件下的性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

CompSLAM在DARPA地下挑战赛决赛中成功部署于多种机器人平台,并助力团队赢得比赛,验证了其在复杂地下环境中的有效性。在包含740米长赛道的数据集上,CompSLAM表现出良好的鲁棒性,能够应对传感器退化和光照变化等挑战。公开的数据集和代码为相关研究提供了宝贵的资源。

🎯 应用场景

CompSLAM可应用于地下矿井、隧道、城市地下管网等复杂环境中的机器人自主导航、搜救、勘探等任务。该研究成果有助于提升机器人在恶劣环境下的作业能力,降低人工操作风险,提高工作效率。未来,CompSLAM有望应用于火星探测等极端环境下的机器人自主探索。

📄 摘要(原文)

Robot autonomy in unknown, GPS-denied, and complex underground environments requires real-time, robust, and accurate onboard pose estimation and mapping for reliable operations. This becomes particularly challenging in perception-degraded subterranean conditions under harsh environmental factors, including darkness, dust, and geometrically self-similar structures. This paper details CompSLAM, a highly resilient and hierarchical multi-modal localization and mapping framework designed to address these challenges. Its flexible architecture achieves resilience through redundancy by leveraging the complementary nature of pose estimates derived from diverse sensor modalities. Developed during the DARPA Subterranean Challenge, CompSLAM was successfully deployed on all aerial, legged, and wheeled robots of Team Cerberus during their competition-winning final run. Furthermore, it has proven to be a reliable odometry and mapping solution in various subsequent projects, with extensions enabling multi-robot map sharing for marsupial robotic deployments and collaborative mapping. This paper also introduces a comprehensive dataset acquired by a manually teleoperated quadrupedal robot, covering a significant portion of the DARPA Subterranean Challenge finals course. This dataset evaluates CompSLAM's robustness to sensor degradations as the robot traverses 740 meters in an environment characterized by highly variable geometries and demanding lighting conditions. The CompSLAM code and the DARPA SubT Finals dataset are made publicly available for the benefit of the robotics community