OpenGV 2.0: Motion prior-assisted calibration and SLAM with vehicle-mounted surround-view systems

📄 arXiv: 2503.03230v1 📥 PDF

作者: Kun Huang, Yifu Wang, Si'ao Zhang, Zhirui Wang, Zhanpeng Ouyang, Zhenghua Yu, Laurent Kneip

分类: cs.RO

发布日期: 2025-03-05


💡 一句话要点

OpenGV 2.0:提出基于运动先验的车辆环视系统标定与SLAM方案

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 车辆环视系统 视觉SLAM 运动先验 外参标定 非完整约束

📋 核心要点

  1. 车辆环视系统SLAM面临视野重叠小、外参标定难等问题,现有方法难以保证精度和鲁棒性。
  2. 利用车辆运动的非完整约束特性,构建运动先验,辅助外参标定、前端初始化和后端优化。
  3. 通过消融实验和大规模数据集验证,表明该框架在城市环境中Ackermann车辆上的有效性。

📝 摘要(中文)

本文提出了一种基于优化的车辆环视相机系统的视觉SLAM解决方案。针对该系统通常只包含少量朝向不同方向的相机,且视野重叠有限的问题,本文创新性地提出了三个优化模块,分别用于:基于简单两视图几何的外部参数在线标定、可靠的相对位移前端初始化,以及使用连续时间轨迹模型的精确后端优化。这些模块的共同点在于,它们都利用了与乘用车运动固有的非完整约束相关的运动先验。与现有技术相比,所提出的模块在绕过Ackermann运动中常见的变换变量的部分不可观测性方面表现出色。此外,这些模块被集成到一个新的环视相机SLAM系统中,专门针对在城市环境中运行的Ackermann车辆。所有模块都在深入的消融研究中进行了研究,并且整个框架的实际有效性通过成功应用于具有挑战性的大规模公开在线数据集得到了支持。该框架计划在接受后作为OpenGV库的扩展进行开源发布。

🔬 方法详解

问题定义:车辆环视相机SLAM旨在利用多个相机提供的图像信息,估计车辆的位姿和构建周围环境地图。然而,车辆环视系统通常视野重叠有限,导致传统SLAM方法在初始化和外参标定方面面临挑战,容易出现不可观测性问题,影响定位精度和地图质量。现有方法对外参标定精度不足,且难以有效利用车辆运动信息。

核心思路:本文的核心思路是利用车辆运动的非完整约束(non-holonomic constraints)作为运动先验,辅助SLAM系统的各个模块。车辆的运动通常受到Ackermann转向模型的约束,例如车辆只能向前或向后移动,不能侧向移动。这些约束信息可以用来约束相机位姿的估计,提高系统的鲁棒性和精度。

技术框架:该SLAM系统包含三个主要模块:1) 基于两视图几何的外部参数在线标定模块;2) 可靠的相对位移前端初始化模块;3) 使用连续时间轨迹模型的精确后端优化模块。这三个模块都利用了车辆运动先验信息。系统首先进行特征提取和匹配,然后利用运动先验进行外参标定和前端初始化,最后通过后端优化进行全局位姿调整和地图构建。

关键创新:该方法最重要的创新点在于将车辆运动先验信息融入到SLAM系统的各个模块中,从而有效地解决了环视系统视野重叠小带来的不可观测性问题。与现有方法相比,该方法能够更准确地估计相机外参和车辆位姿,提高SLAM系统的鲁棒性和精度。此外,该方法针对Ackermann车辆的运动特性进行了专门设计,使其更适用于城市环境。

关键设计:在外部参数标定模块中,使用两视图几何约束和运动先验约束共同优化相机外参。在前端初始化模块中,利用运动先验估计相对位移,并使用RANSAC等方法去除异常值。在后端优化模块中,使用连续时间轨迹模型对车辆轨迹进行建模,并利用运动先验约束轨迹的平滑性。损失函数的设计中,考虑了图像重投影误差、运动先验误差等多种因素。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该方法在公开数据集上进行了验证,结果表明,与现有方法相比,该方法能够显著提高车辆位姿估计的精度和鲁棒性。消融实验表明,运动先验的使用能够有效提高外参标定和前端初始化的精度。具体性能提升数据未知,但论文强调了其在具有挑战性的大规模数据集上的成功应用。

🎯 应用场景

该研究成果可应用于自动驾驶、辅助驾驶、智能交通等领域。通过提高车辆定位精度和环境感知能力,可以提升自动驾驶系统的安全性、可靠性和智能化水平。此外,该技术还可以应用于高精地图构建、城市三维重建等领域,具有广阔的应用前景。

📄 摘要(原文)

The present paper proposes optimization-based solutions to visual SLAM with a vehicle-mounted surround-view camera system. Owing to their original use-case, such systems often only contain a single camera facing into either direction and very limited overlap between fields of view. Our novelty consist of three optimization modules targeting at practical online calibration of exterior orientations from simple two-view geometry, reliable front-end initialization of relative displacements, and accurate back-end optimization using a continuous-time trajectory model. The commonality between the proposed modules is given by the fact that all three of them exploit motion priors that are related to the inherent non-holonomic characteristics of passenger vehicle motion. In contrast to prior related art, the proposed modules furthermore excel in terms of bypassing partial unobservabilities in the transformation variables that commonly occur for Ackermann-motion. As a further contribution, the modules are built into a novel surround-view camera SLAM system that specifically targets deployment on Ackermann vehicles operating in urban environments. All modules are studied in the context of in-depth ablation studies, and the practical validity of the entire framework is supported by a successful application to challenging, large-scale publicly available online datasets. Note that upon acceptance, the entire framework is scheduled for open-source release as part of an extension of the OpenGV library.