A Proprioceptive-Only Benchmark for Quadruped State Estimation: ATE, RPE, and Runtime Trade-offs Between Filters and Smoothers

📄 arXiv: 2605.11674v1 📥 PDF

作者: Ylenia Nisticò, João Carlos Virgolino Soares, Joan Solà, Claudio Semini

分类: cs.RO

发布日期: 2026-05-12

备注: Submitted to IEEE Robotics and Automation Practice

🔗 代码/项目: GITHUB


💡 一句话要点

四足机器人本体感知状态估计基准测试:滤波器与平滑器在ATE、RPE和运行时间上的权衡

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 四足机器人 状态估计 本体感知 基准测试 卡尔曼滤波 平滑算法 绝对轨迹误差 相对位姿误差

📋 核心要点

  1. 四足机器人状态估计面临精度和计算效率的挑战,现有方法在不同指标上表现各异,缺乏统一的评估标准。
  2. 论文对比了MUSE、IEKF和IS三种本体感知状态估计器,旨在分析它们在精度(ATE、RPE)和计算时间上的权衡。
  3. 实验结果表明,IEKF和IS在长期精度(ATE)上优于MUSE,但不同方法在短期精度(RPE)上表现相似,且运行时间各有差异。

📝 摘要(中文)

本文针对四足机器人,对比了三种最先进的本体感知状态估计器:MUSE、不变扩展卡尔曼滤波器(IEKF)和不变平滑器(IS),并在GrandTour数据集的CYN-1序列上进行了评估。目标是为从业者提供关于精度和计算时间的明确指导:报告了长期精度(绝对轨迹误差ATE)、短期精度(平移和旋转相对位姿误差RPE)以及在固定硬件/软件堆栈上的每次更新计算时间。结果表明,在所用数据集上,各种方法的RPE大致相似,而IEKF和IS实现了比MUSE更低的ATE。运行时间结果突出了三种方法在精度和延迟之间的权衡。在讨论中,概述了用于确保公平比较的评估选择,并分析了影响短时程指标的因素。总的来说,这项研究提供了一个关于精度和成本的简明快照,帮助读者选择适合其应用约束的估计器,所有评估代码和文档均以开源形式发布在https://github.com/iit-DLSLab/state_estimation_benchmark,以实现完全的可重复性。

🔬 方法详解

问题定义:论文旨在解决四足机器人仅依赖本体感知(即IMU和关节编码器)进行状态估计时,如何在精度(长期和短期)和计算效率之间进行权衡的问题。现有方法,如MUSE、IEKF和IS,各有优缺点,缺乏一个统一的基准测试来指导实际应用中的选择。现有方法的痛点在于难以在不同应用场景下选择最合适的算法,以及缺乏对不同算法性能差异的深入理解。

核心思路:论文的核心思路是通过在一个公开数据集上,对三种代表性的本体感知状态估计器进行全面的基准测试,从而量化它们在长期精度(ATE)、短期精度(RPE)和计算时间上的性能差异。通过这种方式,为从业者提供选择合适算法的依据,并促进对不同算法优缺点的深入理解。

技术框架:整体框架包括数据采集(使用GrandTour数据集的CYN-1序列),算法实现(MUSE、IEKF、IS),性能评估(ATE、RPE、计算时间)和结果分析。主要模块包括: 1. 数据预处理:对原始数据进行清洗和同步。 2. 状态估计:分别使用MUSE、IEKF和IS进行状态估计。 3. 性能评估:计算ATE、RPE和计算时间。 4. 结果分析:对比不同算法的性能,并分析影响性能的因素。

关键创新:论文的关键创新在于构建了一个针对四足机器人本体感知状态估计的基准测试,并开源了评估代码和文档。这使得研究人员和从业者可以方便地比较不同算法的性能,并选择适合自己应用的算法。此外,论文还深入分析了不同算法在精度和计算时间上的权衡,为算法设计和选择提供了指导。

关键设计:论文的关键设计包括: 1. 使用GrandTour数据集的CYN-1序列作为测试数据,该数据集包含了四足机器人的真实运动数据。 2. 使用ATE和RPE作为评估指标,分别衡量长期和短期精度。 3. 详细记录了每种算法的计算时间,以便进行计算效率的比较。 4. 开源了评估代码和文档,以便其他研究人员可以复现和扩展研究结果。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,IEKF和IS在长期精度(ATE)上优于MUSE,但在短期精度(RPE)上,三种方法表现相似。运行时间结果显示,IEKF的计算时间最短,而IS的计算时间最长。这些结果突出了不同算法在精度和计算时间上的权衡,为实际应用中的算法选择提供了依据。所有评估代码和文档均已开源,方便复现和扩展。

🎯 应用场景

该研究成果可应用于四足机器人的自主导航、运动控制和环境感知等领域。通过选择合适的本体感知状态估计器,可以提高机器人的运动精度和稳定性,从而使其能够在复杂环境中执行任务。此外,该基准测试可以促进四足机器人状态估计算法的进一步发展,并推动四足机器人在搜索救援、物流运输和巡检等领域的应用。

📄 摘要(原文)

We compare three state-of-the-art proprioceptive state estimators for quadruped robots: MUSE [1], the Invariant Extended Kalman Filter (IEKF) [2], and the Invariant Smoother (IS) [3], on the CYN-1 sequence of the GrandTour Dataset [4]. Our goal is to give practitioners clear guidance on accuracy and computation time: we report long-term accuracy (Absolute Trajectory Error, ATE), short-term accuracy (translational and rotational Relative Pose Error, RPE), and per-update computation time on a fixed hardware/software stack. On this dataset, RPEs are broadly similar across methods, while IEKF and IS achieve a lower ATE than MUSE. Runtime results highlight the accuracy-latency trade-offs across the three approaches. In the discussion, we outline the evaluation choices used to ensure a fair comparison and analyze factors that influence short-horizon metrics. Overall, this study provides a concise snapshot of accuracy and cost, helping readers choose an estimator that fits their application constraints, with all evaluation code and documentation released open-source at https://github.com/iit-DLSLab/state_estimation_benchmark for full reproducibility.