Spatiotemporal Calibration and Ground Truth Estimation for High-Precision SLAM Benchmarking in Extended Reality

📄 arXiv: 2512.07221v1 📥 PDF

作者: Zichao Shu, Shitao Bei, Lijun Li, Zetao Chen

分类: cs.RO

发布日期: 2025-12-08

🔗 代码/项目: GITHUB


💡 一句话要点

提出一种时空标定与真值估计方法,用于扩展现实中高精度SLAM基准测试

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: SLAM基准测试 扩展现实 时空标定 运动捕捉 真值估计

📋 核心要点

  1. 现有基于MoCap的SLAM基准测试受限于MoCap抖动和与DUT的时空标定精度,影响了旋转误差和帧间抖动等关键指标的评估。
  2. 提出一种连续时间最大似然估计器,结合IMU数据补偿MoCap抖动,并利用可变时间同步和螺旋一致性约束实现精确时空标定。
  3. 实验结果表明,该方法优于现有方法,能够更精确地评估XR设备和SLAM算法,并已开源代码。

📝 摘要(中文)

同步定位与地图构建(SLAM)在扩展现实(XR)应用中起着至关重要的作用。随着XR沉浸式体验标准的不断提高,对SLAM基准测试的要求也越来越严格。轨迹精度是关键指标,而基于marker的光学运动捕捉(MoCap)系统因其无漂移和相对精确的测量而被广泛用于生成真值(GT)。然而,基于MoCap的GT的精度受到两个因素的限制:与被测设备(DUT)的时空标定以及MoCap测量中固有的抖动。这些限制阻碍了精确的SLAM基准测试,特别是对于旋转误差和帧间抖动等关键指标,这些指标对于沉浸式XR体验至关重要。本文提出了一种新的连续时间最大似然估计器来解决这些挑战。该方法集成了辅助惯性测量单元(IMU)数据来补偿MoCap抖动。此外,提出了一种可变时间同步方法和基于螺旋一致性约束的姿态残差,从而实现了跨多个传感器和DUT的精确时空标定。实验结果表明,我们的方法优于现有方法,实现了对XR应用中最先进的SLAM算法进行全面基准测试所需的精度。此外,我们通过对几种领先的XR设备和开源SLAM算法进行基准测试,充分验证了该方法的实用性。

🔬 方法详解

问题定义:现有基于MoCap的SLAM基准测试方法,其精度受到MoCap系统自身抖动以及与被测设备(DUT)之间时空标定误差的限制。这些误差尤其会影响旋转误差和帧间抖动等关键指标的评估,从而无法准确评估SLAM算法在XR应用中的性能。现有方法难以同时解决抖动和精确时空标定问题。

核心思路:论文的核心思路是利用连续时间最大似然估计器,融合辅助IMU数据来补偿MoCap的抖动,并结合可变时间同步方法和基于螺旋一致性约束的姿态残差,实现高精度的时空标定。通过优化一个统一的目标函数,同时估计传感器之间的相对位姿、时间偏移以及MoCap的抖动参数,从而提高整体的基准测试精度。

技术框架:该方法主要包含以下几个阶段:1) 数据采集:同时采集MoCap数据、DUT的IMU数据以及DUT的视觉数据(如果存在)。2) 预处理:对IMU数据进行预积分,对MoCap数据进行滤波。3) 时空标定:使用提出的连续时间最大似然估计器,优化传感器之间的相对位姿和时间偏移。4) 真值估计:利用标定后的参数和IMU数据,对MoCap数据进行抖动补偿,生成高精度的真值轨迹。5) SLAM基准测试:使用生成的真值轨迹评估SLAM算法的性能。

关键创新:该方法的主要创新点在于:1) 提出了一种连续时间最大似然估计器,能够同时优化时空标定参数和MoCap抖动参数。2) 引入了可变时间同步方法,能够更精确地估计传感器之间的时间偏移。3) 使用基于螺旋一致性约束的姿态残差,提高了姿态标定的精度。与现有方法相比,该方法能够更全面地考虑各种误差源,从而实现更高的基准测试精度。

关键设计:在连续时间最大似然估计器中,目标函数包含多个残差项,包括IMU预积分残差、MoCap姿态残差和时间同步残差。MoCap姿态残差基于螺旋一致性约束,能够更有效地约束姿态估计。时间同步残差则基于可变时间同步方法,能够自适应地调整时间偏移的估计。此外,该方法还使用了鲁棒的核函数来降低异常值的影响。具体参数设置未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在时空标定和真值估计方面均优于现有方法。通过对多种XR设备和开源SLAM算法进行基准测试,验证了该方法的实用性和有效性。具体性能数据未知,但论文强调该方法能够实现对XR应用中最先进的SLAM算法进行全面基准测试所需的精度。

🎯 应用场景

该研究成果可广泛应用于扩展现实(XR)设备的性能评估和SLAM算法的基准测试。通过提供高精度的真值轨迹,可以更准确地评估SLAM算法的定位精度、鲁棒性和实时性,从而促进SLAM技术在XR领域的应用和发展。此外,该方法还可以应用于机器人导航、无人机控制等需要高精度定位的领域。

📄 摘要(原文)

Simultaneous localization and mapping (SLAM) plays a fundamental role in extended reality (XR) applications. As the standards for immersion in XR continue to increase, the demands for SLAM benchmarking have become more stringent. Trajectory accuracy is the key metric, and marker-based optical motion capture (MoCap) systems are widely used to generate ground truth (GT) because of their drift-free and relatively accurate measurements. However, the precision of MoCap-based GT is limited by two factors: the spatiotemporal calibration with the device under test (DUT) and the inherent jitter in the MoCap measurements. These limitations hinder accurate SLAM benchmarking, particularly for key metrics like rotation error and inter-frame jitter, which are critical for immersive XR experiences. This paper presents a novel continuous-time maximum likelihood estimator to address these challenges. The proposed method integrates auxiliary inertial measurement unit (IMU) data to compensate for MoCap jitter. Additionally, a variable time synchronization method and a pose residual based on screw congruence constraints are proposed, enabling precise spatiotemporal calibration across multiple sensors and the DUT. Experimental results demonstrate that our approach outperforms existing methods, achieving the precision necessary for comprehensive benchmarking of state-of-the-art SLAM algorithms in XR applications. Furthermore, we thoroughly validate the practicality of our method by benchmarking several leading XR devices and open-source SLAM algorithms. The code is publicly available at https://github.com/ylab-xrpg/xr-hpgt.