Variable-Frequency Model Learning and Predictive Control for Jumping Maneuvers on Legged Robots

📄 arXiv: 2407.14749v2 📥 PDF

作者: Chuong Nguyen, Abdullah Altawaitan, Thai Duong, Nikolay Atanasov, Quan Nguyen

分类: cs.RO

发布日期: 2024-07-20 (更新: 2024-12-06)

备注: 8 pages, accepted to RAL 2024

🔗 代码/项目: GITHUB


💡 一句话要点

提出基于变频模型学习与预测控制的跳跃控制方法,提升腿式机器人跳跃机动性能。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 腿式机器人 跳跃控制 模型预测控制 模型学习 变频控制 动态机动 强化学习

📋 核心要点

  1. 腿式机器人在复杂地形上的跳跃机动面临模型不确定性和环境扰动,传统方法难以兼顾精度与鲁棒性。
  2. 该论文提出一种基于变频模型学习的MPC方法,直接从实验数据中学习模型,并利用变频策略优化控制。
  3. 实验结果表明,该方法在Unitree A1机器人上显著降低了跳跃距离误差,并在复杂地形上表现出良好的鲁棒性。

📝 摘要(中文)

针对腿式机器人在高跳或远跳等长飞行阶段的动态机动中,难以同时保证目标精度和鲁棒性的问题,本文提出了一种基于学习的控制方法,该方法包含模型学习和利用变频方案的模型预测控制(MPC)。与现有MPC技术相比,我们直接从实验中学习模型,不仅考虑了腿部动力学,还考虑了硬件和接触过程中的建模误差和未知动力学失配。此外,使用变频学习模型使我们能够覆盖整个飞行阶段和最终跳跃目标,从而提高跳跃轨迹的预测精度。利用学习到的模型,我们还设计了变频方案,以有效地利用不同的跳跃阶段并准确跟踪目标。在Unitree A1机器人硬件上进行的92次跳跃实验验证了我们的方法优于使用固定频率或标称模型的其他MPC,跳跃距离误差降低了2到8倍。在不平坦地形上进行连续跳跃,并随机放置高度随机的扰动(高达4厘米,或机器人站立高度的27%)时,我们实现了小于3%的跳跃距离误差。在具有不同跳跃目标和模型不确定性的34次单次和连续跳跃中,我们的方法获得了1到2厘米的距离误差。代码可在https://github.com/DRCL-USC/Learning MPC Jumping 获取。

🔬 方法详解

问题定义:腿式机器人的跳跃控制,尤其是在长飞行阶段的跳跃,对精度和鲁棒性提出了很高的要求。现有的模型预测控制(MPC)方法通常依赖于标称模型,难以准确描述腿部动力学、建模误差以及硬件和接触过程中的未知动力学失配,导致控制性能下降。此外,固定频率的MPC无法有效利用跳跃的不同阶段,限制了控制精度。

核心思路:该论文的核心思路是通过实验数据学习一个更准确的机器人模型,并结合变频MPC来优化跳跃轨迹。通过直接从实验中学习模型,可以有效补偿建模误差和未知动力学,提高预测精度。变频MPC允许根据跳跃的不同阶段调整控制频率,从而更有效地利用不同阶段的特性,提高控制性能。

技术框架:整体框架包括两个主要模块:模型学习和变频MPC。首先,通过实验数据学习一个能够准确描述机器人动力学的模型。然后,利用学习到的模型设计一个变频MPC控制器,该控制器根据跳跃的不同阶段调整控制频率,优化跳跃轨迹。整个流程包括数据采集、模型训练、控制器设计和在线控制等步骤。

关键创新:该论文的关键创新在于将模型学习和变频MPC相结合,用于腿式机器人的跳跃控制。传统的MPC方法通常依赖于标称模型,而该论文直接从实验数据中学习模型,从而更准确地描述机器人动力学。此外,变频MPC允许根据跳跃的不同阶段调整控制频率,从而更有效地利用不同阶段的特性。

关键设计:模型学习的具体方法未知,但强调了从实验数据中学习,以捕捉腿部动力学、建模误差和未知动力学失配。变频MPC的关键设计在于如何根据跳跃阶段动态调整控制频率。论文中提到利用学习到的模型设计变频方案,但具体的设计细节未知。损失函数的设计也未知,但可以推测其目标是最小化跳跃距离误差,并考虑控制输入的约束。

📊 实验亮点

在Unitree A1机器人上的实验结果表明,该方法优于使用固定频率或标称模型的其他MPC,跳跃距离误差降低了2到8倍。在不平坦地形上进行连续跳跃,并随机放置高度随机的扰动(高达4厘米,或机器人站立高度的27%)时,实现了小于3%的跳跃距离误差。在具有不同跳跃目标和模型不确定性的34次单次和连续跳跃中,获得了1到2厘米的距离误差。

🎯 应用场景

该研究成果可应用于腿式机器人在复杂地形下的运动控制,例如搜索救援、物流运输、侦察巡逻等领域。通过提高跳跃机动的精度和鲁棒性,可以使腿式机器人更好地适应各种复杂环境,扩展其应用范围。此外,该方法也可以推广到其他类型的机器人和运动控制任务中。

📄 摘要(原文)

Achieving both target accuracy and robustness in dynamic maneuvers with long flight phases, such as high or long jumps, has been a significant challenge for legged robots. To address this challenge, we propose a novel learning-based control approach consisting of model learning and model predictive control (MPC) utilizing a variable-frequency scheme. Compared to existing MPC techniques, we learn a model directly from experiments, accounting not only for leg dynamics but also for modeling errors and unknown dynamics mismatch in hardware and during contact. Additionally, learning the model with variable-frequency allows us to cover the entire flight phase and final jumping target, enhancing the prediction accuracy of the jumping trajectory. Using the learned model, we also design variable-frequency to effectively leverage different jumping phases and track the target accurately. In a total of 92 jumps on Unitree A1 robot hardware, we verify that our approach outperforms other MPCs using fixed frequency or nominal model, reducing the jumping distance error 2 to 8 times. We also achieve jumping distance errors of less than 3 percent during continuous jumping on uneven terrain with randomly placed perturbations of random heights (up to 4 cm or 27 percent the robot standing height). Our approach obtains distance errors of 1 to 2 cm on 34 single and continuous jumps with different jumping targets and model uncertainties. Code is available at https://github.com/DRCL-USC/Learning MPC Jumping.