System Identification under Constraints and Disturbance: A Bayesian Estimation Approach
作者: Sergi Martinez, Steve Tonneau, Carlos Mastalli
分类: cs.RO
发布日期: 2026-02-18
💡 一句话要点
提出一种贝叶斯系统辨识框架,用于高精度估计机器人状态轨迹和物理参数。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 系统辨识 贝叶斯估计 机器人控制 摩擦模型 约束优化
📋 核心要点
- 现有系统辨识方法难以同时保证物理一致性、处理复杂约束和准确估计摩擦模型。
- 该论文提出贝叶斯系统辨识框架,结合物理约束、能量回归和贝叶斯估计,提升参数辨识精度。
- 实验表明,该方法在机器人系统上能更快收敛、降低误差,并改善模型预测控制的跟踪性能。
📝 摘要(中文)
本文提出了一种贝叶斯系统辨识(SysID)框架,用于高精度地联合估计机器人的状态轨迹和物理参数。该框架将物理一致的逆动力学、接触和闭环约束以及全功能的关节摩擦模型嵌入为硬性的、阶段性的等式约束。它依赖于基于能量的回归器来增强参数的可观测性,支持惯性和驱动参数上的等式和不等式先验,强制执行动态一致的扰动投影,并利用能量观测来增强本体感受测量,从而消除非线性摩擦效应的歧义。为了确保可扩展性,我们推导了一种参数化的等式约束Riccati递归,该递归保留了问题的带状结构,实现了时间范围内的线性复杂度,并开发了计算高效的导数。在具有代表性的机器人系统上的仿真研究,以及在配备Z1手臂的Unitree B1上的硬件实验,表明与前向动力学和解耦辨识基线相比,收敛速度更快,惯性和摩擦估计误差更低,接触一致性更好。当部署在模型预测控制框架中时,由此产生的模型在具有挑战性的环境中进行运动时,在跟踪性能方面产生了可衡量的改进。
🔬 方法详解
问题定义:现有的机器人系统辨识方法通常难以同时满足多个要求。例如,保证物理一致性(如逆动力学约束),处理复杂的接触和闭环约束,以及准确估计关节摩擦模型。此外,参数的可观测性问题和计算复杂度也是挑战。现有方法在处理非线性摩擦效应时也存在局限性,并且难以有效利用先验信息。
核心思路:该论文的核心思路是将系统辨识问题建模为一个贝叶斯估计问题,并显式地将物理约束(逆动力学、接触、闭环)作为硬约束嵌入到优化过程中。通过引入基于能量的回归器来增强参数的可观测性,并利用能量观测来辅助辨识非线性摩擦效应。同时,利用参数化的Riccati递归来降低计算复杂度,提高算法的可扩展性。
技术框架:该框架包含以下主要模块: 1. 数据收集:收集机器人的状态轨迹、力/力矩传感器数据、关节角度和速度等数据。 2. 模型构建:构建包含逆动力学、接触约束、闭环约束和关节摩擦模型的系统动力学模型。 3. 贝叶斯估计:将系统辨识问题建模为贝叶斯估计问题,利用收集到的数据和先验信息,估计机器人的物理参数和状态轨迹。 4. 优化求解:利用参数化的Riccati递归求解带约束的贝叶斯估计问题,得到最优的参数估计。
关键创新:该论文的关键创新在于: 1. 硬约束嵌入:将物理约束作为硬约束嵌入到优化过程中,保证了辨识结果的物理一致性。 2. 能量回归器:利用基于能量的回归器增强参数的可观测性,提高了参数辨识的精度。 3. 参数化Riccati递归:推导了一种参数化的Riccati递归,降低了计算复杂度,提高了算法的可扩展性。 4. 能量观测:利用能量观测辅助辨识非线性摩擦效应,提高了摩擦模型辨识的准确性。
关键设计: 1. 摩擦模型:采用了全功能的关节摩擦模型,能够更准确地描述关节的摩擦特性。 2. 先验信息:支持惯性和驱动参数上的等式和不等式先验,能够有效利用已知的先验知识。 3. 扰动投影:强制执行动态一致的扰动投影,提高了辨识结果的鲁棒性。 4. Riccati递归参数化:通过对Riccati递归进行参数化,保留了问题的带状结构,实现了时间范围内的线性复杂度。
🖼️ 关键图片
📊 实验亮点
在Unitree B1四足机器人和Z1机械臂的硬件实验中,该方法与前向动力学和解耦辨识基线相比,收敛速度更快,惯性和摩擦估计误差更低,接触一致性更好。在模型预测控制框架中,使用该方法辨识的模型在复杂环境下的运动跟踪性能得到了显著提升。
🎯 应用场景
该研究成果可应用于机器人控制、仿真和故障诊断等领域。精确的系统辨识能够提升机器人控制器的性能,尤其是在复杂环境下的运动控制。此外,该方法可以用于创建更精确的机器人仿真模型,并帮助诊断机器人系统的潜在故障。
📄 摘要(原文)
We introduce a Bayesian system identification (SysID) framework for jointly estimating robot's state trajectories and physical parameters with high accuracy. It embeds physically consistent inverse dynamics, contact and loop-closure constraints, and fully featured joint friction models as hard, stage-wise equality constraints. It relies on energy-based regressors to enhance parameter observability, supports both equality and inequality priors on inertial and actuation parameters, enforces dynamically consistent disturbance projections, and augments proprioceptive measurements with energy observations to disambiguate nonlinear friction effects. To ensure scalability, we derive a parameterized equality-constrained Riccati recursion that preserves the banded structure of the problem, achieving linear complexity in the time horizon, and develop computationally efficient derivatives. Simulation studies on representative robotic systems, together with hardware experiments on a Unitree B1 equipped with a Z1 arm, demonstrate faster convergence, lower inertial and friction estimation errors, and improved contact consistency compared to forward-dynamics and decoupled identification baselines. When deployed within model predictive control frameworks, the resulting models yield measurable improvements in tracking performance during locomotion over challenging environments.