Advancements in Translation Accuracy for Stereo Visual-Inertial Initialization

作者: Han Song, Zhongche Qu, Zhi Zhang, Zihan Ye, Cong Liu

分类: cs.RO

发布日期: 2024-05-23 (更新: 2024-08-18)

💡 一句话要点

提出基于3自由度BA的视觉惯性初始化方法，提升平移精度。

🎯 匹配领域: 支柱三：空间感知与语义 (Perception & Semantics)

关键词: 视觉惯性SLAM 初始化 Bundle Adjustment 平移精度 IMU融合

📋 核心要点

ORB-SLAM3初始化依赖纯视觉SLAM，在复杂场景下精度受限，且Stereo-NEC计算成本高。
提出3自由度BA优化平移，并融合IMU信息更新旋转，提升初始化阶段的平移精度。
在EuRoC数据集上的实验表明，该方法在精度方面优于现有方法。

📝 摘要（中文）

现有的立体视觉惯性SLAM框架ORB-SLAM3的初始化方法存在局限性，其成功依赖于纯立体SLAM系统的性能，并基于纯视觉SLAM能够准确估计相机轨迹的假设，这对于惯性参数估计至关重要。ORB-SLAM3的改进版本Stereo-NEC由于应用关键点跟踪和基于极线约束估计陀螺仪偏差，因此耗时较长。为了解决上述方法的局限性，本文提出了一种旨在提高初始化阶段平移精度的方法。该方法的核心思想是使用一个独立的3自由度(DoF)的Bundle Adjustment (BA)来改进平移估计，同时固定旋转估计，而不是使用ORB-SLAM3的6自由度BA。此外，与ORB-SLAM3直接从立体视觉里程计获取旋转估计不同，本文通过考虑IMU测量和陀螺仪偏差来更新旋转估计，这在具有挑战性的场景中可能会产生更好的结果。我们在公共基准EuRoC数据集上进行了广泛的评估，证明了我们方法在精度方面的优越性。

🔬 方法详解

问题定义：ORB-SLAM3的初始化方法依赖于纯视觉SLAM的准确性，在光照变化剧烈、纹理缺失等挑战性场景下，纯视觉SLAM的轨迹估计可能存在较大误差，导致后续的惯性参数估计不准确。Stereo-NEC虽然尝试改进，但其基于关键点跟踪和极线约束的陀螺仪偏差估计过程计算量大，耗时较长。因此，需要一种更鲁棒、更高效的初始化方法，以提高视觉惯性SLAM系统的整体性能。

核心思路：该论文的核心思路是将平移和旋转的优化解耦，分别进行处理。首先，固定旋转估计，使用3自由度的Bundle Adjustment (BA)来优化平移，这样可以更专注于平移的优化，避免旋转误差对平移的影响。然后，利用IMU测量值和陀螺仪偏差来更新旋转估计，从而提高旋转估计的准确性。这种解耦优化策略可以更有效地利用视觉和惯性信息，提高初始化精度。

技术框架：该方法主要包含以下几个阶段：1) 特征提取与匹配：从立体图像中提取特征点，并进行匹配。2) 初始位姿估计：使用立体视觉里程计估计相机的初始位姿。3) 3自由度BA优化平移：固定旋转，使用3自由度的BA优化平移向量。4) IMU融合与旋转更新：利用IMU测量值和陀螺仪偏差更新旋转矩阵。5) 惯性参数估计：利用优化后的位姿和IMU数据估计惯性参数。

关键创新：该方法最重要的技术创新点在于将平移和旋转的优化解耦，并分别进行处理。与ORB-SLAM3的6自由度BA相比，3自由度BA可以更专注于平移的优化，避免旋转误差的影响。同时，利用IMU测量值和陀螺仪偏差更新旋转估计，可以提高旋转估计的准确性。这种解耦优化策略可以更有效地利用视觉和惯性信息，提高初始化精度。

关键设计：在3自由度BA中，只优化平移向量，旋转矩阵保持固定。损失函数通常采用重投影误差，即特征点在图像上的观测位置与根据相机位姿和三维点坐标计算出的投影位置之间的差异。IMU融合部分，可以使用预积分方法，将IMU测量值积分得到位姿增量，然后将其与视觉估计的位姿进行融合，更新旋转矩阵。陀螺仪偏差的估计可以使用卡尔曼滤波等方法。

🖼️ 关键图片

📊 实验亮点

该方法在EuRoC数据集上进行了广泛的评估，实验结果表明，该方法在平移精度方面优于ORB-SLAM3等现有方法。具体的性能数据（例如，平均平移误差降低百分比）未知，但摘要明确指出该方法在精度方面表现出色。

🎯 应用场景

该研究成果可应用于增强现实、机器人导航、无人机自主飞行等领域。更精确的视觉惯性初始化能够提升SLAM系统的鲁棒性和精度，尤其是在光照变化剧烈、纹理缺失等挑战性环境中，具有重要的实际应用价值。未来，该方法可以进一步扩展到单目视觉惯性SLAM系统，并与其他传感器融合，以实现更可靠的定位和建图。

📄 摘要（原文）

As the current initialization method in the state-of-the-art Stereo Visual-Inertial SLAM framework, ORB-SLAM3 has limitations. Its success depends on the performance of the pure stereo SLAM system and is based on the underlying assumption that pure visual SLAM can accurately estimate the camera trajectory, which is essential for inertial parameter estimation. Meanwhile, the further improved initialization method for ORB-SLAM3, known as Stereo-NEC, is time-consuming due to applying keypoint tracking to estimate gyroscope bias with normal epipolar constraints. To address the limitations of previous methods, this paper proposes a method aimed at enhancing translation accuracy during the initialization stage. The fundamental concept of our method is to improve the translation estimate with a 3 Degree-of-Freedom (DoF) Bundle Adjustment (BA), independently, while the rotation estimate is fixed, instead of using ORB-SLAM3's 6-DoF BA. Additionally, the rotation estimate will be updated by considering IMU measurements and gyroscope bias, unlike ORB-SLAM3's rotation, which is directly obtained from stereo visual odometry and may yield inferior results when operating in challenging scenarios. We also conduct extensive evaluations on the public benchmark, the EuRoC dataset, demonstrating that our method excels in accuracy.

Advancements in Translation Accuracy for Stereo Visual-Inertial Initialization

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理