RK-MPC: Residual Koopman Model Predictive Control for Quadruped Locomotion in Offroad Environments

📄 arXiv: 2604.04221 📥 PDF

作者: Sriram S. K. S. Narayanan, Umesh Vaidya

分类: cs.RO

发布日期: 2026-04-07


💡 一句话要点

提出RK-MPC:基于残差Koopman模型的四足机器人越野环境模型预测控制

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 四足机器人 模型预测控制 Koopman算子 残差学习 越野环境 数据驱动控制 机器人控制

📋 核心要点

  1. 现有四足机器人控制方法难以应对复杂地形和接触变化带来的模型失配问题,导致预测精度下降。
  2. RK-MPC通过学习残差模型来补偿标称模型的不足,在提升坐标系中进行线性预测,提高预测精度。
  3. 实验表明,RK-MPC在多种地形和步态下实现了稳定的盲运动,并优于传统的Koopman方法。

📝 摘要(中文)

本文提出了一种基于Koopman的残差Koopman模型预测控制(RK-MPC)框架,用于四足机器人的运动控制。该方法通过在提升坐标系中学习到的紧凑线性残差预测器来增强标称模板模型,从而系统地校正由接触变化和地形扰动引起的模型失配,并提供多步预测误差的可证明界限。学习到的残差模型嵌入到凸二次规划MPC公式中,产生一个以500 Hz在板上运行的后退水平线控制器,并保留了基于优化的控制的结构和约束处理优势。在Gazebo仿真和Unitree Go1硬件实验中评估了RK-MPC,证明了其在接触扰动、多种步态计划以及包括草地、砾石、雪地和冰面等具有挑战性的越野地形上的可靠盲运动能力。此外,还使用包括单项式和$SE(3)$-结构化基在内的替代可观测字典,与Koopman/EDMD基线进行了比较,结果表明残差校正提高了多步预测和闭环性能,同时降低了对可观测选择的敏感性。总体而言,RK-MPC为非结构化环境中四足机器人的数据驱动预测控制提供了一条实用的、经过硬件验证的途径。

🔬 方法详解

问题定义:四足机器人在越野环境中运动时,由于地形复杂、接触情况多变,传统的基于模型的控制方法难以准确预测机器人的状态。模型预测控制(MPC)依赖于精确的模型,模型失配会导致控制性能下降,甚至导致机器人摔倒。现有的Koopman方法虽然可以学习系统的动态特性,但仍然难以处理复杂的非线性系统和外部扰动。

核心思路:RK-MPC的核心思路是利用数据驱动的方法学习一个残差模型,用于补偿标称模型(template model)的预测误差。标称模型提供了一个基本的动力学描述,而残差模型则学习了标称模型未能捕捉到的复杂动态特性和外部扰动的影响。通过将残差模型与标称模型相结合,可以提高预测精度,从而改善MPC的控制性能。

技术框架:RK-MPC的整体框架包括以下几个主要模块:1) 数据采集:通过在不同地形和步态下运行机器人,采集机器人的状态数据。2) Koopman算子学习:利用扩展动态模式分解(EDMD)等方法,在提升坐标系中学习Koopman算子,得到线性化的系统动态模型。3) 残差模型学习:学习一个线性残差模型,用于预测Koopman算子预测的误差。4) 模型预测控制:将学习到的Koopman模型和残差模型嵌入到MPC框架中,求解最优控制序列。

关键创新:RK-MPC的关键创新在于引入了残差模型来补偿Koopman模型的预测误差。传统的Koopman方法直接使用Koopman算子进行预测,而RK-MPC则通过学习残差模型,可以更准确地预测系统的未来状态。此外,RK-MPC还提供多步预测误差的可证明界限,保证了控制器的稳定性。

关键设计:RK-MPC的关键设计包括:1) 选择合适的提升坐标系:提升坐标系的选择会影响Koopman算子的学习效果。论文中比较了单项式和$SE(3)$-结构化基等不同的提升坐标系。2) 残差模型的结构:残差模型采用线性模型,可以保证计算效率。3) MPC的优化目标函数:MPC的优化目标函数包括状态误差、控制量和残差项,通过调整这些项的权重,可以平衡控制性能和计算复杂度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

RK-MPC在Gazebo仿真和Unitree Go1硬件实验中都取得了显著的成果。在多种地形(草地、砾石、雪地、冰面)和步态下,RK-MPC实现了稳定的盲运动。与传统的Koopman/EDMD基线相比,RK-MPC提高了多步预测精度和闭环控制性能,并降低了对可观测选择的敏感性。该方法能够在500Hz的频率下实时运行。

🎯 应用场景

RK-MPC可应用于各种复杂地形下的四足机器人运动控制,例如搜索救援、物流运输、农业巡检等。该方法能够提高机器人在非结构化环境中的自主导航能力和鲁棒性,降低对环境感知的依赖,具有重要的实际应用价值。未来,RK-MPC可以进一步扩展到其他类型的机器人和控制任务中。

📄 摘要(原文)

This paper presents Residual Koopman MPC (RK-MPC), a Koopman-based, data-driven model predictive control framework for quadruped locomotion that improves prediction fidelity while preserving real-time tractability. RK-MPC augments a nominal template model with a compact linear residual predictor learned from data in lifted coordinates, enabling systematic correction of model mismatch induced by contact variability and terrain disturbances with provable bounds on multi-step prediction error. The learned residual model is embedded within a convex quadratic-program MPC formulation, yielding a receding-horizon controller that runs onboard at 500 Hz and retains the structure and constraint-handling advantages of optimization-based control. We evaluate RK-MPC in both Gazebo simulation and Unitree Go1 hardware experiments, demonstrating reliable blind locomotion across contact disturbances, multiple gait schedules, and challenging off-road terrains including grass, gravel, snow, and ice. We further compare against Koopman/EDMD baselines using alternative observable dictionaries, including monomial and $SE(3)$-structured bases, and show that the residual correction improves multi-step prediction and closed-loop performance while reducing sensitivity to the choice of observables. Overall, RK-MPC provides a practical, hardware-validated pathway for data-driven predictive control of quadrupeds in unstructured environments. Seethis https URLfor implementation videos.