Variable-Frequency Model Learning and Predictive Control for Jumping Maneuvers on Legged Robots

作者: Chuong Nguyen, Abdullah Altawaitan, Thai Duong, Nikolay Atanasov, Quan Nguyen

分类: cs.RO

发布日期: 2024-07-20 (更新: 2024-12-06)

备注: 8 pages, accepted to RAL 2024

🔗 代码/项目: GITHUB

💡 一句话要点

提出基于变频模型学习与预测控制的跳跃控制方法，提升腿式机器人跳跃机动性能。

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 腿式机器人 跳跃控制 模型预测控制 模型学习 变频控制 动态机动 强化学习

📋 核心要点

腿式机器人在复杂地形上的跳跃机动面临模型不确定性和环境扰动，传统方法难以兼顾精度与鲁棒性。
该论文提出一种基于变频模型学习的MPC方法，直接从实验数据中学习模型，并利用变频策略优化控制。
实验结果表明，该方法在Unitree A1机器人上显著降低了跳跃距离误差，并在复杂地形上表现出良好的鲁棒性。

📝 摘要（中文）

针对腿式机器人在高跳或远跳等长飞行阶段的动态机动中，难以同时保证目标精度和鲁棒性的问题，本文提出了一种基于学习的控制方法，该方法包含模型学习和利用变频方案的模型预测控制（MPC）。与现有MPC技术相比，我们直接从实验中学习模型，不仅考虑了腿部动力学，还考虑了硬件和接触过程中的建模误差和未知动力学失配。此外，使用变频学习模型使我们能够覆盖整个飞行阶段和最终跳跃目标，从而提高跳跃轨迹的预测精度。利用学习到的模型，我们还设计了变频方案，以有效地利用不同的跳跃阶段并准确跟踪目标。在Unitree A1机器人硬件上进行的92次跳跃实验验证了我们的方法优于使用固定频率或标称模型的其他MPC，跳跃距离误差降低了2到8倍。在不平坦地形上进行连续跳跃，并随机放置高度随机的扰动（高达4厘米，或机器人站立高度的27％）时，我们实现了小于3％的跳跃距离误差。在具有不同跳跃目标和模型不确定性的34次单次和连续跳跃中，我们的方法获得了1到2厘米的距离误差。代码可在https://github.com/DRCL-USC/Learning MPC Jumping 获取。

🔬 方法详解

问题定义：腿式机器人的跳跃控制，尤其是在长飞行阶段的跳跃，对精度和鲁棒性提出了很高的要求。现有的模型预测控制（MPC）方法通常依赖于标称模型，难以准确描述腿部动力学、建模误差以及硬件和接触过程中的未知动力学失配，导致控制性能下降。此外，固定频率的MPC无法有效利用跳跃的不同阶段，限制了控制精度。

核心思路：该论文的核心思路是通过实验数据学习一个更准确的机器人模型，并结合变频MPC来优化跳跃轨迹。通过直接从实验中学习模型，可以有效补偿建模误差和未知动力学，提高预测精度。变频MPC允许根据跳跃的不同阶段调整控制频率，从而更有效地利用不同阶段的特性，提高控制性能。

技术框架：整体框架包括两个主要模块：模型学习和变频MPC。首先，通过实验数据学习一个能够准确描述机器人动力学的模型。然后，利用学习到的模型设计一个变频MPC控制器，该控制器根据跳跃的不同阶段调整控制频率，优化跳跃轨迹。整个流程包括数据采集、模型训练、控制器设计和在线控制等步骤。

关键创新：该论文的关键创新在于将模型学习和变频MPC相结合，用于腿式机器人的跳跃控制。传统的MPC方法通常依赖于标称模型，而该论文直接从实验数据中学习模型，从而更准确地描述机器人动力学。此外，变频MPC允许根据跳跃的不同阶段调整控制频率，从而更有效地利用不同阶段的特性。

关键设计：模型学习的具体方法未知，但强调了从实验数据中学习，以捕捉腿部动力学、建模误差和未知动力学失配。变频MPC的关键设计在于如何根据跳跃阶段动态调整控制频率。论文中提到利用学习到的模型设计变频方案，但具体的设计细节未知。损失函数的设计也未知，但可以推测其目标是最小化跳跃距离误差，并考虑控制输入的约束。

📊 实验亮点

在Unitree A1机器人上的实验结果表明，该方法优于使用固定频率或标称模型的其他MPC，跳跃距离误差降低了2到8倍。在不平坦地形上进行连续跳跃，并随机放置高度随机的扰动（高达4厘米，或机器人站立高度的27％）时，实现了小于3％的跳跃距离误差。在具有不同跳跃目标和模型不确定性的34次单次和连续跳跃中，获得了1到2厘米的距离误差。

🎯 应用场景

该研究成果可应用于腿式机器人在复杂地形下的运动控制，例如搜索救援、物流运输、侦察巡逻等领域。通过提高跳跃机动的精度和鲁棒性，可以使腿式机器人更好地适应各种复杂环境，扩展其应用范围。此外，该方法也可以推广到其他类型的机器人和运动控制任务中。

📄 摘要（原文）

Achieving both target accuracy and robustness in dynamic maneuvers with long flight phases, such as high or long jumps, has been a significant challenge for legged robots. To address this challenge, we propose a novel learning-based control approach consisting of model learning and model predictive control (MPC) utilizing a variable-frequency scheme. Compared to existing MPC techniques, we learn a model directly from experiments, accounting not only for leg dynamics but also for modeling errors and unknown dynamics mismatch in hardware and during contact. Additionally, learning the model with variable-frequency allows us to cover the entire flight phase and final jumping target, enhancing the prediction accuracy of the jumping trajectory. Using the learned model, we also design variable-frequency to effectively leverage different jumping phases and track the target accurately. In a total of 92 jumps on Unitree A1 robot hardware, we verify that our approach outperforms other MPCs using fixed frequency or nominal model, reducing the jumping distance error 2 to 8 times. We also achieve jumping distance errors of less than 3 percent during continuous jumping on uneven terrain with randomly placed perturbations of random heights (up to 4 cm or 27 percent the robot standing height). Our approach obtains distance errors of 1 to 2 cm on 34 single and continuous jumps with different jumping targets and model uncertainties. Code is available at https://github.com/DRCL-USC/Learning MPC Jumping.

Variable-Frequency Model Learning and Predictive Control for Jumping Maneuvers on Legged Robots

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理