Learning to enhance multi-legged robot on rugged landscapes

📄 arXiv: 2409.09473v1 📥 PDF

作者: Juntao He, Baxi Chong, Zhaochen Xu, Sehoon Ha, Daniel I. Goldman

分类: cs.RO, cs.LG

发布日期: 2024-09-14

备注: Submitted to ICRA 2025


💡 一句话要点

提出基于强化学习的多足机器人控制框架,提升崎岖地形的运动性能。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 多足机器人 强化学习 运动控制 崎岖地形 MuJoCo 机器人仿真

📋 核心要点

  1. 多足机器人虽然在崎岖地形具有优势,但现有线性控制方法在应对复杂地形异质性时存在局限。
  2. 论文提出基于强化学习的控制框架,通过动态调整水平和垂直身体起伏以及肢体步进,优化机器人运动。
  3. 实验结果表明,该方法在模拟和真实环境中均能有效提升机器人速度,相比线性控制器提升30%-50%。

📝 摘要(中文)

在崎岖地形上导航对腿式机器人提出了重大挑战。多足机器人(六条腿及以上)为此类地形提供了一个有希望的解决方案,这主要归功于其固有的高静态稳定性,这是由低重心和宽支撑面带来的。此类系统只需最少的努力即可保持平衡。最近的研究表明,一种线性控制器可以通过调节多足机器人的垂直身体起伏来响应地形粗糙度的变化,从而确保在具有挑战性的地形上的可靠移动性。然而,基于学习的控制框架调整多个参数以解决地形异质性的潜力仍未得到充分探索。我们认为,为此机器人开发经过实验验证的基于物理的模拟器可以通过允许广泛的参数空间探索来快速提高能力。在这里,我们开发了一个基于 MuJoCo 的模拟器,该模拟器专为此机器人平台定制,并使用该模拟器开发了一个基于强化学习的控制框架,该框架可以实时动态调整水平和垂直身体起伏以及肢体步进。我们的方法提高了机器人在模拟、实验室实验和户外测试中的性能。值得注意的是,我们的真实世界实验表明,与仅调节垂直身体波的线性控制器相比,基于学习的控制器实现了 30% 到 50% 的速度提升。我们假设基于学习的控制器的卓越性能源于其能够同时调整多个参数,包括肢体步进、水平身体波和垂直身体波。

🔬 方法详解

问题定义:论文旨在解决多足机器人在复杂崎岖地形上的高效运动控制问题。现有线性控制方法虽然能保证一定的稳定性,但无法充分利用机器人的多自由度,难以适应地形的异质性,导致运动速度受限。

核心思路:论文的核心思路是利用强化学习,让机器人通过与环境的交互,自主学习最优的控制策略。通过同时调整多个参数(包括水平和垂直身体起伏、肢体步进),使机器人能够更好地适应地形变化,从而提高运动速度和效率。

技术框架:整体框架包括一个基于 MuJoCo 的机器人仿真环境和一个强化学习算法。首先,在仿真环境中训练机器人,学习控制策略。然后,将学习到的策略迁移到真实机器人上进行测试和验证。强化学习算法负责根据机器人的状态和环境反馈,不断优化控制策略。

关键创新:最重要的技术创新点在于将强化学习应用于多足机器人的运动控制,并实现了多个控制参数的协同优化。与传统的线性控制方法相比,该方法能够更好地适应复杂地形,实现更高的运动性能。

关键设计:论文使用 MuJoCo 物理引擎构建了高精度的机器人仿真环境。强化学习算法采用了一种 Actor-Critic 结构,Actor 网络负责输出控制指令,Critic 网络负责评估当前状态的价值。奖励函数的设计至关重要,需要综合考虑机器人的速度、稳定性、能量消耗等因素。具体参数设置和网络结构在论文中进行了详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,基于强化学习的控制器在真实环境中实现了显著的性能提升。与仅调节垂直身体波的线性控制器相比,该控制器在速度上提升了 30% 到 50%。此外,该方法在模拟环境、实验室环境和户外环境均取得了良好的效果,验证了其泛化能力和鲁棒性。

🎯 应用场景

该研究成果可应用于搜救机器人、勘探机器人、农业机器人等领域。这些机器人需要在复杂、崎岖的地形上执行任务,例如灾后救援、矿产勘探、农田巡检等。通过使用该论文提出的控制方法,可以显著提高机器人的运动能力和工作效率,使其能够更好地完成任务。

📄 摘要(原文)

Navigating rugged landscapes poses significant challenges for legged locomotion. Multi-legged robots (those with 6 and greater) offer a promising solution for such terrains, largely due to their inherent high static stability, resulting from a low center of mass and wide base of support. Such systems require minimal effort to maintain balance. Recent studies have shown that a linear controller, which modulates the vertical body undulation of a multi-legged robot in response to shifts in terrain roughness, can ensure reliable mobility on challenging terrains. However, the potential of a learning-based control framework that adjusts multiple parameters to address terrain heterogeneity remains underexplored. We posit that the development of an experimentally validated physics-based simulator for this robot can rapidly advance capabilities by allowing wide parameter space exploration. Here we develop a MuJoCo-based simulator tailored to this robotic platform and use the simulation to develop a reinforcement learning-based control framework that dynamically adjusts horizontal and vertical body undulation, and limb stepping in real-time. Our approach improves robot performance in simulation, laboratory experiments, and outdoor tests. Notably, our real-world experiments reveal that the learning-based controller achieves a 30\% to 50\% increase in speed compared to a linear controller, which only modulates vertical body waves. We hypothesize that the superior performance of the learning-based controller arises from its ability to adjust multiple parameters simultaneously, including limb stepping, horizontal body wave, and vertical body wave.