Gait-Net-augmented Implicit Kino-dynamic MPC for Dynamic Variable-frequency Humanoid Locomotion over Discrete Terrains
作者: Junheng Li, Ziwei Duan, Junchao Ma, Quan Nguyen
分类: cs.RO, eess.SY
发布日期: 2025-02-05 (更新: 2025-05-28)
备注: 15 pages, 13 figures, RSS 2025 accepted
💡 一句话要点
提出Gait-Net增强的隐式运动动力学MPC,用于动态变频人形机器人跨越离散地形的步态控制。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 人形机器人 模型预测控制 步态规划 变频运动 离散地形 神经网络 序列凸优化
📋 核心要点
- 基于降阶模型的机器人运动优化控制方法难以同时调整步长和步时,对扰动响应不足,在复杂地形表现欠佳。
- 提出Gait-Net增强的隐式运动动力学MPC,通过Gait-Net预测步频,并结合序列凸优化,实现步长、步时和接触力的同步优化。
- 在高保真仿真和小尺寸人形机器人上验证,结果表明该方法能够实现变频和三维离散地形的运动控制,且仅需一步地形数据预览。
📝 摘要(中文)
本文提出了一种Gait-Net增强的隐式运动动力学模型预测控制(MPC),用于同时优化步长位置、步长持续时间和接触力,以实现自然变频运动。该方法结合了Gait-Net增强的序列凸MPC算法,通过迭代二次规划来解决多线性约束变量。核心在于,轻量级的步频网络(Gait-Net)根据可变的MPC采样时间确定最佳步长持续时间,从而将步长持续时间优化简化到参数级别。此外,它通过结合局部解来增强和更新每个序列迭代中的空间参考轨迹,从而允许将运动学约束投影到参考轨迹的设计中。我们在高保真仿真和小尺寸人形机器人硬件上验证了所提出的算法,证明了其在仅需一步地形数据预览的情况下,进行变频和三维离散地形运动的能力。
🔬 方法详解
问题定义:现有基于降阶模型的人形机器人运动规划方法,由于依赖固定时间离散化,难以同时优化步长和步时,导致对外部扰动的响应速度慢,在复杂地形上的表现不佳。尤其是在需要快速调整步频以适应地形变化或保持平衡时,固定步时的约束会限制机器人的运动能力。
核心思路:本文的核心思路是利用一个轻量级的神经网络(Gait-Net)来预测期望的步频,并将步频信息融入到模型预测控制(MPC)框架中。通过将步频作为优化变量,MPC能够同时优化步长、步时和接触力,从而实现更自然、更灵活的变频运动。Gait-Net的引入简化了步时优化,将其从复杂的轨迹优化问题转化为参数优化问题。
技术框架:该方法采用Gait-Net增强的序列凸MPC算法。整体流程如下:1) Gait-Net根据当前状态(例如,机器人质心位置、速度、姿态等)预测期望的步频。2) MPC利用预测的步频信息,结合机器人动力学模型和环境约束,生成最优的步长、步时和接触力。3) 将MPC的输出作为机器人的控制指令,驱动机器人运动。4) 在每个MPC迭代中,利用局部解更新空间参考轨迹,并将运动学约束投影到参考轨迹的设计中。
关键创新:该方法最重要的创新点在于将神经网络(Gait-Net)与模型预测控制(MPC)相结合,实现了步频的自适应调整。与传统的固定步时MPC方法相比,该方法能够更好地适应复杂地形和外部扰动,从而提高机器人的运动性能。此外,利用局部解更新空间参考轨迹,并将运动学约束投影到参考轨迹的设计中,进一步提高了运动规划的效率和鲁棒性。
关键设计:Gait-Net是一个轻量级的神经网络,输入是机器人的状态信息,输出是期望的步频。MPC采用序列凸优化方法,将非线性优化问题转化为一系列二次规划问题进行求解。损失函数包括跟踪误差、控制力矩和步频变化率等。地形数据采用一步预览,即MPC只考虑当前步的下一步地形信息。
🖼️ 关键图片
📊 实验亮点
在高保真仿真中,该方法能够成功控制人形机器人在三维离散地形上行走,并实现变频运动。在小尺寸人形机器人硬件上的实验结果表明,该方法能够有效地应对外部扰动,并保持机器人的平衡。与传统的固定步时MPC方法相比,该方法能够显著提高机器人的运动性能和鲁棒性。具体性能数据未知,但实验结果表明该方法具有良好的应用前景。
🎯 应用场景
该研究成果可应用于各种需要人形机器人进行复杂地形行走的场景,例如搜救、勘探、物流等。通过自适应调整步频和步长,机器人能够更安全、更高效地完成任务。此外,该方法还可以扩展到其他类型的机器人,例如四足机器人和轮式机器人,以提高其在复杂环境中的运动能力。未来,该技术有望在智能家居、医疗康复等领域发挥重要作用。
📄 摘要(原文)
Reduced-order-model-based optimal control techniques for humanoid locomotion struggle to adapt step duration and placement simultaneously in dynamic walking gaits due to their reliance on fixed-time discretization, which limits responsiveness to various disturbances and results in suboptimal performance in challenging conditions. In this work, we propose a Gait-Net-augmented implicit kino-dynamic model-predictive control (MPC) to simultaneously optimize step location, step duration, and contact forces for natural variable-frequency locomotion. The proposed method incorporates a Gait-Net-augmented Sequential Convex MPC algorithm to solve multi-linearly constrained variables by iterative quadratic programs. At its core, a lightweight Gait-frequency Network (Gait-Net) determines the preferred step duration in terms of variable MPC sampling times, simplifying step duration optimization to the parameter level. Additionally, it enhances and updates the spatial reference trajectory within each sequential iteration by incorporating local solutions, allowing the projection of kinematic constraints to the design of reference trajectories. We validate the proposed algorithm in high-fidelity simulations and on small-size humanoid hardware, demonstrating its capability for variable-frequency and 3-D discrete terrain locomotion with only a one-step preview of terrain data.