Rapid co-design of Buoyancy-assisted robots for Challenging Locomotion using Gaussian Evolutionary Specialists

📄 arXiv: 2606.07424v1 📥 PDF

作者: Ankit Sinha, Nitish Sontakke, Dennis Hong, Yusuke Tanaka, Sehoon Ha

分类: cs.RO

发布日期: 2026-06-05

备注: Submitted to RA-L


💡 一句话要点

提出高效的设计优化框架以提升浮力辅助机器人运动能力

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 机器人设计 强化学习 高斯进化 运动优化 控制策略 多样性行为 性能提升

📋 核心要点

  1. 现有的模型无关强化学习在共同设计中成本高昂,导致策略训练的重复性和效率低下。
  2. 本文提出的高斯进化专家(GES)框架通过解耦设计空间划分与策略学习,显式捕捉多样化行为,降低了训练成本。
  3. 在实验中,GES优化的设计在硬件上成功克服24厘米高的障碍,相比基线设计提升了3倍的性能。

📝 摘要(中文)

设计高性能的腿式机器人需要同时优化其形态和控制。模型无关的强化学习(RL)为开发稳健的控制器提供了一种替代模型预测控制的方法。然而,在共同设计的内循环中使用RL成本高昂,因其需要反复训练策略。本文提出了高斯进化专家(GES)框架,通过将设计空间划分与策略学习解耦,显式捕捉多样化行为。GES为不断演化的高斯区域分配专家策略,并通过训练、探测和领土扩展迭代优化。实验结果表明,GES在浮力辅助轻型腿部单元(BALLU)上发现的设计性能比简单的通用策略高出5%至25%。

🔬 方法详解

问题定义:本文旨在解决在腿式机器人设计中,现有模型无关强化学习方法在共同设计内循环中的高成本和效率低下的问题。现有方法往往导致策略训练的重复性,限制了设计优化的速度和效果。

核心思路:论文提出的高斯进化专家(GES)框架通过将设计空间划分与策略学习解耦,能够显式捕捉多样化的行为,从而避免了策略收敛到单一策略的现象。

技术框架:GES框架包括几个主要模块:首先是设计空间的高斯区域划分,其次是为每个区域分配专家策略,最后通过训练、探测和领土扩展迭代优化这些策略。整个流程通过直接评估替代了昂贵的重新训练过程。

关键创新:GES的核心创新在于其通过高斯区域的划分与专家策略的分配,显著提高了设计优化的效率和多样性,克服了现有方法在行为多样性上的不足。

关键设计:在GES中,专家策略的训练采用了针对特定高斯区域的优化方法,确保每个区域的策略能够适应其特定的设计特征。此外,设计采样循环的集成使得评估过程更加高效,减少了设计优化的时间。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,GES优化的设计在性能上比简单的通用策略高出5%至25%。在硬件测试中,GES优化的设计成功克服了24厘米高的障碍,相比基线BALLU设计实现了3倍的性能提升,同时设计优化时间减少了37%。

🎯 应用场景

该研究的潜在应用领域包括机器人设计、自动化制造和智能控制系统等。通过优化机器人形态与控制策略的协同设计,能够提升机器人在复杂环境中的运动能力,具有重要的实际价值和广泛的应用前景。

📄 摘要(原文)

Designing high-performance legged robots requires jointly optimizing morphology and control. Model-free Reinforcement Learning (RL) offers an alternative to model-predictive control for developing robust controllers without explicitly specifying robot dynamics. Thus, we have seen theuse of RL to train controllers and evaluate designs for robot morphology optimization. While RL has shown success inlocomotion, using it in the co-design inner loop is expensive due to repeated policy training. Universal policies conditioned on morphology offer a promising alternative, but suffer from behavioral diversity collapse, converging to a single strategy that performs sub-optimally across designs. On the other hand, end-to-end Mixture-of-Experts (MoE) architectures fail due to a collapse in its representation. We propose Gaussian Evolutionary Specialists (GES), a framework that decouples design-space partitioning from policy learning to capture diverse behaviors explicitly. GES assigns specialist policies to evolving Gaussian regions and iteratively refines them via training, probing, and territory expansion. The resulting specialists are integrated into a design sampling loop, replacing costly re-training with direct evaluation. When tested on the Buoyancy-Assisted Light Legged Unit (BALLU), GES discovers designs with 5 - 25% higher performance than naive universal policies. On hardware, a GES optimized design overcomes a 24 cm tall obstacle - 3x improvement over the baseline BALLU design. Moreover, GES curtails design optimization time by 37%.