Online Optimization of Central Pattern Generators for Quadruped Locomotion
作者: Zewei Zhang, Guillaume Bellegarda, Milad Shafiee, Auke Ijspeert
分类: cs.RO
发布日期: 2024-10-21
备注: Accepted by IROS2024
💡 一句话要点
提出基于贝叶斯优化的CPG在线优化框架,实现四足机器人快速适应地形与负载变化。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 四足机器人 中央模式发生器 贝叶斯优化 在线优化 运动控制
📋 核心要点
- 传统四足机器人控制器依赖离线设计或训练,难以适应真实世界快速变化的环境和任务需求。
- 论文提出基于贝叶斯优化的CPG在线优化方法,使机器人能够通过少量交互快速提升运动技能。
- 实验表明,该方法能使机器人在不同摩擦系数、负载和坡度下快速优化步态,提高能量效率。
📝 摘要(中文)
本文提出了一种用于四足机器人运动的中央模式发生器(CPG)参数在线优化框架,该框架利用贝叶斯优化算法。与传统的离线设计或训练方法不同,该框架能够快速优化CPG参数,并适应不同的速度指令和地形变化,例如摩擦系数、地形坡度和机器人负载的变化。研究还探讨了感觉反馈对CPG的影响,发现力反馈和姿态控制(虚拟模型控制)均有助于提高机器人的稳定性和能量效率。在Unitree Go1机器人上的硬件实验表明,该框架能够在3分钟内快速优化能量效率高的步态,并适应各种场景:不同的摩擦系数、高达15公斤的负载以及高达10度的坡度。
🔬 方法详解
问题定义:四足机器人的运动控制通常依赖于离线设计或训练的控制器,这些控制器难以适应真实世界中复杂多变的环境,例如不同的地形、摩擦系数和负载变化。现有的基于CPG的控制方法通常需要大量的手动调整或使用遗传算法进行离线优化,效率较低,难以满足实时适应的需求。
核心思路:本文的核心思路是利用贝叶斯优化算法在线优化CPG的参数。贝叶斯优化是一种高效的全局优化方法,特别适用于优化目标函数评估成本较高的场景。通过在线优化,机器人可以在与环境交互的过程中不断调整CPG参数,从而快速适应不同的运动指令和环境变化。
技术框架:该框架主要包含以下几个模块:1) CPG模型:用于生成机器人的运动轨迹。2) 感觉反馈:包括力反馈和姿态控制(虚拟模型控制),用于提高机器人的稳定性和能量效率。3) 贝叶斯优化器:用于在线优化CPG的参数,以最小化能量消耗或最大化运动速度等目标函数。整体流程是:机器人根据当前CPG参数执行运动,通过传感器获取环境反馈,贝叶斯优化器根据反馈结果调整CPG参数,重复此过程直到达到期望的性能。
关键创新:最重要的技术创新点在于将贝叶斯优化应用于CPG的在线参数优化。与传统的离线优化方法相比,该方法能够实现快速的在线适应,无需大量的手动调整或离线训练。此外,论文还研究了感觉反馈对CPG的影响,并发现力反馈和姿态控制均有助于提高机器人的性能。
关键设计:CPG模型采用标准的耦合振荡器模型,其参数包括振幅、频率、相位偏移等。贝叶斯优化器使用高斯过程作为目标函数的先验模型,并采用期望提升(Expected Improvement)作为采集函数。力反馈被引入到CPG的相位方程中,用于调整机器人的步态。姿态控制采用虚拟模型控制方法,通过计算期望的关节力矩来保持机器人的平衡。
🖼️ 关键图片
📊 实验亮点
在Unitree Go1机器人上的实验结果表明,该框架能够在3分钟内快速优化能量效率高的步态,并适应各种场景:不同的摩擦系数、高达15公斤的负载以及高达10度的坡度。与传统的离线优化方法相比,该方法能够显著提高机器人的适应性和鲁棒性。
🎯 应用场景
该研究成果可应用于各种需要四足机器人进行复杂地形适应和负载变化的场景,例如搜救、物流、巡检等。通过在线优化,机器人可以快速适应不同的环境和任务需求,提高工作效率和安全性。此外,该方法还可以推广到其他类型的机器人和运动控制问题中。
📄 摘要(原文)
Typical legged locomotion controllers are designed or trained offline. This is in contrast to many animals, which are able to locomote at birth, and rapidly improve their locomotion skills with few real-world interactions. Such motor control is possible through oscillatory neural networks located in the spinal cord of vertebrates, known as Central Pattern Generators (CPGs). Models of the CPG have been widely used to generate locomotion skills in robotics, but can require extensive hand-tuning or offline optimization of inter-connected parameters with genetic algorithms. In this paper, we present a framework for the \textit{online} optimization of the CPG parameters through Bayesian Optimization. We show that our framework can rapidly optimize and adapt to varying velocity commands and changes in the terrain, for example to varying coefficients of friction, terrain slope angles, and added mass payloads placed on the robot. We study the effects of sensory feedback on the CPG, and find that both force feedback in the phase equations, as well as posture control (Virtual Model Control) are both beneficial for robot stability and energy efficiency. In hardware experiments on the Unitree Go1, we show rapid optimization (in under 3 minutes) and adaptation of energy-efficient gaits to varying target velocities in a variety of scenarios: varying coefficients of friction, added payloads up to 15 kg, and variable slopes up to 10 degrees. See demo at: https://youtu.be/4qq5leCI2AI