Learning to Move in Rhythm: Task-Conditioned Motion Policies with Orbital Stability Guarantees
作者: Maximilian Stölzle, T. Konstantin Rusch, Zach J. Patterson, Rodrigo Pérez-Dattari, Francesco Stella, Josie Hughes, Cosimo Della Santina, Daniela Rus
分类: cs.RO, cs.AI
发布日期: 2025-07-12
备注: 73 pages
💡 一句话要点
提出OSMP框架,结合学习的微分同胚编码器与Hopf分岔,实现轨道稳定且任务可控的周期运动控制。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)
关键词: 运动基元 轨道稳定性 Hopf分岔 机器人控制 周期运动 微分同胚 任务条件学习
📋 核心要点
- 动态运动基元(DMP)虽然具有内置稳定性和抗扰动能力,但在捕捉复杂周期性行为和任务间插值方面存在局限性。
- OSMP框架结合了学习的微分同胚编码器和Hopf分岔,从演示中学习周期运动,并保证轨道稳定性和横向收缩。
- 通过任务条件编码器,OSMP能用单一策略表示多个运动目标,实现对未见目标的零样本泛化,并在多种机器人平台上验证了其有效性。
📝 摘要(中文)
本文提出了一种名为轨道稳定运动基元(OSMP)的框架,该框架结合了学习的微分同胚编码器和潜在空间中的超临界Hopf分岔,从而能够从演示中准确地获取周期性运动,同时确保轨道稳定性和横向收缩的形式保证。此外,通过将双射编码器与任务相关联,单个学习策略能够表示多个运动目标,从而在训练分布内实现对未见运动目标的一致零样本泛化。通过在各种机器人平台上(从协作臂和软体机械手到仿生刚柔结合的乌龟机器人)进行的大量仿真和真实世界实验验证了所提出方法的有效性,证明了其在持续优于最先进的基线(如扩散策略等)方面的多功能性和有效性。
🔬 方法详解
问题定义:现有的动态运动基元(DMP)在处理复杂的周期性运动时存在局限性,难以捕捉其内在的周期性结构。此外,DMP在不同任务之间的泛化能力较弱,难以适应新的运动目标。这些缺点限制了DMP在实际应用中的范围,例如步态运动和节奏性工具使用等任务。
核心思路:本文的核心思路是将学习的微分同胚编码器与潜在空间中的超临界Hopf分岔相结合。微分同胚编码器用于将高维的运动轨迹映射到低维的潜在空间,而Hopf分岔则用于在潜在空间中生成稳定的周期性运动。通过这种方式,OSMP能够从演示中学习到周期性运动的内在结构,并保证运动的轨道稳定性。此外,通过将编码器与任务相关联,OSMP能够实现对不同任务的泛化。
技术框架:OSMP框架主要包含以下几个模块:1) 运动轨迹编码器:使用神经网络学习一个微分同胚映射,将高维的运动轨迹映射到低维的潜在空间。2) Hopf分岔控制器:在潜在空间中设计一个超临界Hopf分岔控制器,用于生成稳定的周期性运动。3) 运动轨迹解码器:使用神经网络学习一个微分同胚映射的逆映射,将潜在空间中的运动轨迹解码回高维空间。4) 任务条件模块:将编码器与任务相关联,实现对不同任务的泛化。
关键创新:OSMP的关键创新在于将学习的微分同胚编码器与Hopf分岔相结合,从而能够从演示中学习到周期性运动的内在结构,并保证运动的轨道稳定性。与传统的DMP相比,OSMP能够更好地处理复杂的周期性运动,并具有更强的泛化能力。此外,OSMP还提供了形式化的轨道稳定性保证,这在机器人控制领域是非常重要的。
关键设计:在编码器和解码器的设计中,使用了神经网络来学习微分同胚映射及其逆映射。Hopf分岔控制器的参数需要根据具体的任务进行调整,以保证运动的稳定性和周期性。任务条件模块的设计需要考虑到不同任务之间的相似性和差异性,以便实现有效的泛化。损失函数的设计需要同时考虑运动的准确性和稳定性。
🖼️ 关键图片
📊 实验亮点
通过仿真和真实机器人实验,OSMP在多种机器人平台上(包括协作臂、软体机械手和仿生乌龟机器人)都表现出优于现有方法的性能。例如,在周期性运动生成任务中,OSMP能够更准确地捕捉运动的周期性结构,并具有更强的抗扰动能力。与扩散策略等基线方法相比,OSMP在泛化能力和稳定性方面均有显著提升。
🎯 应用场景
OSMP框架在机器人控制领域具有广泛的应用前景,例如步态运动控制、节奏性工具使用、柔性机器人控制等。该框架可以用于开发更加智能、灵活和安全的机器人系统,提高机器人在复杂环境中的适应性和鲁棒性。此外,OSMP框架还可以应用于虚拟现实、游戏等领域,用于生成更加逼真和自然的运动动画。
📄 摘要(原文)
Learning from demonstration provides a sample-efficient approach to acquiring complex behaviors, enabling robots to move robustly, compliantly, and with fluidity. In this context, Dynamic Motion Primitives offer built - in stability and robustness to disturbances but often struggle to capture complex periodic behaviors. Moreover, they are limited in their ability to interpolate between different tasks. These shortcomings substantially narrow their applicability, excluding a wide class of practically meaningful tasks such as locomotion and rhythmic tool use. In this work, we introduce Orbitally Stable Motion Primitives (OSMPs) - a framework that combines a learned diffeomorphic encoder with a supercritical Hopf bifurcation in latent space, enabling the accurate acquisition of periodic motions from demonstrations while ensuring formal guarantees of orbital stability and transverse contraction. Furthermore, by conditioning the bijective encoder on the task, we enable a single learned policy to represent multiple motion objectives, yielding consistent zero-shot generalization to unseen motion objectives within the training distribution. We validate the proposed approach through extensive simulation and real-world experiments across a diverse range of robotic platforms - from collaborative arms and soft manipulators to a bio-inspired rigid-soft turtle robot - demonstrating its versatility and effectiveness in consistently outperforming state-of-the-art baselines such as diffusion policies, among others.