Floorplan-SLAM: A Real-Time, High-Accuracy, and Long-Term Multi-Session Point-Plane SLAM for Efficient Floorplan Reconstruction

📄 arXiv: 2503.00397v3 📥 PDF

作者: Haolin Wang, Zeren Lv, Hao Wei, Haijiang Zhu, Yihong Wu

分类: cs.RO, cs.CV

发布日期: 2025-03-01 (更新: 2025-03-05)


💡 一句话要点

Floorplan-SLAM:一种实时、高精度、长期的多会话点面SLAM,用于高效的平面图重建

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 平面图重建 SLAM 多会话SLAM 点面SLAM 实时重建

📋 核心要点

  1. 现有平面图重建方法要么需要耗时的离线处理,要么依赖昂贵的传感器和大量的计算资源。
  2. Floorplan-SLAM将平面图重建紧密集成到多会话SLAM系统中,通过平面提取、位姿估计和后端优化实现实时重建。
  3. 实验表明,Floorplan-SLAM在平面提取、位姿估计和平面图重建方面优于现有方法,且无需GPU加速即可实现实时性能。

📝 摘要(中文)

本文提出Floorplan-SLAM,通过将平面图重建紧密集成到多会话SLAM系统中,实现实时、高精度和长期的平面图重建。该系统通过与平面提取、位姿估计和后端优化无缝交互,仅使用立体相机即可实现上述目标。具体而言,提出了一种鲁棒的平面提取算法,该算法在紧凑的平面参数空间中运行,并利用空间互补特征来准确检测平面结构,即使在弱纹理场景中也是如此。此外,提出了一个与SLAM系统紧密耦合的平面图重建模块,该模块使用持续优化的平面地标和位姿来制定和解决一个新的优化问题,从而实现实时增量平面图重建。通过利用多会话SLAM的地图合并能力,该方法支持跨多个会话的长期平面图重建,而无需冗余数据收集。在VECtor和自收集数据集上的实验表明,Floorplan-SLAM在平面提取鲁棒性、位姿估计精度以及平面图重建保真度和速度方面显著优于现有方法,在没有GPU加速的情况下实现了25-45 FPS的实时性能,从而将1000平方米场景的平面图重建时间从10小时以上缩短到仅9.44分钟。

🔬 方法详解

问题定义:现有平面图重建方法存在局限性,离线方法耗时,在线方法依赖昂贵传感器和高算力,难以兼顾效率和精度。因此,需要一种能够实时、高精度且长期进行平面图重建的SLAM系统。

核心思路:Floorplan-SLAM的核心在于将平面图重建与SLAM系统紧密耦合,利用SLAM提供的位姿估计和地图信息,反过来优化平面图重建。通过多会话SLAM,实现长期、无冗余数据收集的平面图重建。

技术框架:Floorplan-SLAM包含以下主要模块:1) 鲁棒的平面提取模块,用于准确检测平面结构;2) 位姿估计模块,提供相机位姿信息;3) 平面图重建模块,利用优化的平面地标和位姿解决优化问题,实现实时增量重建;4) 后端优化模块,用于全局优化地图和位姿;5) 多会话SLAM模块,支持地图合并和长期重建。

关键创新:Floorplan-SLAM的关键创新在于:1) 提出了一种鲁棒的平面提取算法,能够在弱纹理场景下准确检测平面;2) 将平面图重建与SLAM系统紧密耦合,实现实时增量重建;3) 利用多会话SLAM实现长期、无冗余数据收集的平面图重建。与现有方法相比,Floorplan-SLAM在效率、精度和鲁棒性方面都有显著提升。

关键设计:平面提取算法在紧凑的平面参数空间中运行,并利用空间互补特征。平面图重建模块通过优化平面地标和位姿来解决优化问题。多会话SLAM利用地图合并技术实现长期重建。具体的参数设置、损失函数和网络结构等细节在论文中有详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

Floorplan-SLAM在VECtor和自收集数据集上进行了评估,结果表明,该方法在平面提取鲁棒性、位姿估计精度以及平面图重建保真度和速度方面显著优于现有方法。在没有GPU加速的情况下,实现了25-45 FPS的实时性能,将1000平方米场景的平面图重建时间从10小时以上缩短到仅9.44分钟。

🎯 应用场景

Floorplan-SLAM在室内机器人导航、高层场景理解、建筑信息模型(BIM)构建、虚拟现实(VR)和增强现实(AR)等领域具有广泛的应用前景。它可以为机器人提供结构化的环境先验知识,提高导航的可靠性。同时,可以用于快速构建室内环境的3D模型,为VR/AR应用提供基础。

📄 摘要(原文)

Floorplan reconstruction provides structural priors essential for reliable indoor robot navigation and high-level scene understanding. However, existing approaches either require time-consuming offline processing with a complete map, or rely on expensive sensors and substantial computational resources. To address the problems, we propose Floorplan-SLAM, which incorporates floorplan reconstruction tightly into a multi-session SLAM system by seamlessly interacting with plane extraction, pose estimation, and back-end optimization, achieving real-time, high-accuracy, and long-term floorplan reconstruction using only a stereo camera. Specifically, we present a robust plane extraction algorithm that operates in a compact plane parameter space and leverages spatially complementary features to accurately detect planar structures, even in weakly textured scenes. Furthermore, we propose a floorplan reconstruction module tightly coupled with the SLAM system, which uses continuously optimized plane landmarks and poses to formulate and solve a novel optimization problem, thereby enabling real-time incremental floorplan reconstruction. Note that by leveraging the map merging capability of multi-session SLAM, our method supports long-term floorplan reconstruction across multiple sessions without redundant data collection. Experiments on the VECtor and the self-collected datasets indicate that Floorplan-SLAM significantly outperforms state-of-the-art methods in terms of plane extraction robustness, pose estimation accuracy, and floorplan reconstruction fidelity and speed, achieving real-time performance at 25-45 FPS without GPU acceleration, which reduces the floorplan reconstruction time for a 1000 square meters scene from over 10 hours to just 9.44 minutes.