BIM Informed Visual SLAM for Construction Monitoring

📄 arXiv: 2509.13972v2 📥 PDF

作者: Asier Bikandi-Noya, Miguel Fernandez-Cortizas, Muhammad Shaheer, Ali Tourani, Holger Voos, Jose Luis Sanchez-Lopez

分类: cs.RO

发布日期: 2025-09-17 (更新: 2025-10-08)

备注: 8 pages, 5 tables, 4 figures


💡 一句话要点

提出一种BIM约束的RGB-D SLAM系统,用于提升建筑工地监测精度。

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 视觉SLAM 建筑信息模型 RGB-D相机 建筑工地监测 结构先验 后端优化 图优化

📋 核心要点

  1. 传统视觉SLAM在重复、遮挡和低纹理的建筑环境中易漂移,限制了其在建筑监测中的应用。
  2. 该论文提出一种RGB-D SLAM系统,利用BIM作为结构先验知识,通过墙体对应关系约束后端优化。
  3. 实验结果表明,该方法在真实建筑工地中能有效降低轨迹误差和地图RMSE,提升了SLAM精度。

📝 摘要(中文)

本文提出了一种用于建筑工地监测的、基于建筑信息模型(BIM)的视觉SLAM系统。在建筑工地,将竣工状态与设计蓝图对齐,有助于及早发现错误并减少代价高昂的返工。虽然基于激光雷达的SLAM能实现高精度,但其传感器通常体积大、功耗高,限制了其在便携平台上的应用。视觉SLAM提供了一种实用的替代方案,轻量级相机已嵌入到大多数移动设备中。然而,视觉SLAM在建筑环境中面临挑战:重复的布局、遮挡以及不完整或低纹理的结构通常会导致轨迹漂移。为了解决这个问题,我们提出了一种RGB-D SLAM系统,该系统将BIM作为结构先验知识。我们的系统不是仅仅依赖视觉线索,而是不断地建立检测到的墙体与其BIM对应物之间的对应关系,然后将其作为约束引入到后端优化中。所提出的方法可以实时运行,并在真实的建筑工地上进行了验证,与视觉SLAM基线相比,轨迹误差平均降低了23.71%,地图的RMSE降低了7.14%。这些结果表明,即使在部分施工条件下,BIM约束也能可靠地将数字计划与竣工场景对齐。

🔬 方法详解

问题定义:现有视觉SLAM方法在建筑工地等复杂环境中,由于场景的重复性、遮挡以及低纹理等问题,容易出现轨迹漂移和地图构建不准确的情况。这限制了视觉SLAM在建筑监测领域的应用,尤其是在需要将竣工状态与设计蓝图进行精确对齐的场景下。现有方法缺乏对建筑结构信息的有效利用,导致鲁棒性和精度不足。

核心思路:该论文的核心思路是将建筑信息模型(BIM)作为结构先验知识融入到视觉SLAM系统中。通过建立视觉SLAM观测到的墙体与BIM模型中对应墙体的关联,将BIM信息转化为约束条件,从而提高SLAM系统的定位精度和地图构建的准确性。这种方法利用了BIM模型提供的全局结构信息,弥补了视觉SLAM在特征缺失或模糊场景下的不足。

技术框架:该系统是一个基于RGB-D相机的SLAM系统,其整体框架包括以下几个主要模块:1) 视觉前端:负责从RGB-D图像中提取视觉特征,并进行初步的位姿估计。2) BIM对应模块:检测场景中的墙体,并与BIM模型中的墙体进行匹配,建立对应关系。3) 后端优化:将视觉特征和BIM约束结合起来,通过图优化方法对位姿和地图进行全局优化。该流程持续进行,不断更新位姿和地图,实现实时的定位和建图。

关键创新:该论文最重要的技术创新点在于将BIM信息作为结构先验知识,并将其有效地融入到视觉SLAM的后端优化中。与传统的视觉SLAM方法相比,该方法不仅利用了视觉特征,还利用了BIM模型提供的全局结构信息,从而提高了SLAM系统的鲁棒性和精度。这种方法能够有效地解决建筑工地等复杂环境中视觉SLAM容易出现漂移的问题。

关键设计:BIM对应模块是关键设计之一,需要精确地检测和匹配场景中的墙体与BIM模型中的墙体。这可能涉及到使用图像分割、目标检测等技术来提取墙体信息,并使用诸如ICP(Iterative Closest Point)等算法进行匹配。后端优化部分需要设计合适的损失函数,将视觉重投影误差和BIM约束误差结合起来,以实现全局最优的位姿和地图估计。具体的参数设置和损失函数形式在论文中可能没有详细描述,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在真实建筑工地环境中,与传统的视觉SLAM基线方法相比,轨迹误差平均降低了23.71%,地图的RMSE降低了7.14%。这些数据表明,通过引入BIM约束,可以显著提高视觉SLAM在建筑工地环境中的定位精度和地图构建质量,验证了该方法的有效性。

🎯 应用场景

该研究成果可广泛应用于建筑工地的自动化监测、竣工验收、以及数字化孪生等领域。通过将竣工状态与BIM模型进行实时比对,可以及早发现施工偏差,减少返工成本,提高施工质量。此外,该技术还可以应用于室内导航、机器人巡检等场景,具有重要的实际应用价值和广阔的发展前景。

📄 摘要(原文)

Simultaneous Localization and Mapping (SLAM) is a key tool for monitoring construction sites, where aligning the evolving as-built state with the as-planned design enables early error detection and reduces costly rework. LiDAR-based SLAM achieves high geometric precision, but its sensors are typically large and power-demanding, limiting their use on portable platforms. Visual SLAM offers a practical alternative with lightweight cameras already embedded in most mobile devices. however, visually mapping construction environments remains challenging: repetitive layouts, occlusions, and incomplete or low-texture structures often cause drift in the trajectory map. To mitigate this, we propose an RGB-D SLAM system that incorporates the Building Information Model (BIM) as structural prior knowledge. Instead of relying solely on visual cues, our system continuously establishes correspondences between detected wall and their BIM counterparts, which are then introduced as constraints in the back-end optimization. The proposed method operates in real time and has been validated on real construction sites, reducing trajectory error by an average of 23.71% and map RMSE by 7.14% compared to visual SLAM baselines. These results demonstrate that BIM constraints enable reliable alignment of the digital plan with the as-built scene, even under partially constructed conditions.