Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization
作者: Xiaoyu Zhang, Steven Haener, Varun Madabushi, Maegan Tucker
分类: cs.RO
发布日期: 2026-03-10
💡 一句话要点
提出KDMR框架,通过多接触全身轨迹优化实现拟人运动重定向
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture) 支柱四:生成式动作 (Generative Motion) 支柱七:动作重定向 (Motion Retargeting)
关键词: 运动重定向 人形机器人 全身轨迹优化 多接触动力学 模仿学习
📋 核心要点
- 传统运动重定向方法依赖运动学数据,易产生物理不一致的伪影,影响模仿学习策略。
- KDMR框架通过多接触全身轨迹优化,显式地强制执行刚体动力学和接触互补约束。
- 实验表明,KDMR优于传统方法,生成动态可行的轨迹,加速策略收敛并提升稳定性。
📝 摘要(中文)
本文提出了一种名为KinoDynamic Motion Retargeting (KDMR) 的框架,这是一种用于人形机器人运动的新方法,它将重定向过程建模为一个多接触、全身轨迹优化问题。传统的基于运动学的重定向方法仅依赖于空间运动捕捉 (MoCap) 数据,不可避免地会引入物理上不一致的伪影,例如脚部滑动和地面穿透,这会严重降低下游模仿学习策略的性能。为了弥合这一差距,KDMR 通过显式地强制执行刚体动力学和接触互补约束,超越了纯粹的运动学。此外,通过整合地面反作用力 (GRF) 测量以及 MoCap 数据,我们的方法自动检测脚跟-脚趾接触事件,以准确复制复杂的人类接触模式。我们通过三个关键维度评估 KDMR 与最先进的基线 GMR:1) 重定向运动的动态可行性和平滑性,2) GRF 跟踪与原始源数据的准确性,以及 3) 通过 BeyondMimic 框架训练的下游控制策略的训练效率和最终性能。实验结果表明,KDMR 显着优于纯粹的运动学方法,产生了动态可行的参考轨迹,从而加速了策略收敛并增强了整体运动稳定性。我们的端到端流程将在发布后开源。
🔬 方法详解
问题定义:现有基于运动学的运动重定向方法,仅依赖空间运动捕捉数据,忽略了物理约束,导致重定向后的运动存在脚部滑动、地面穿透等不符合物理规律的现象。这些伪影会严重影响下游控制策略的训练效果和最终性能。因此,需要一种能够生成物理上可行的人形机器人运动轨迹的重定向方法。
核心思路:KDMR框架的核心思路是将运动重定向问题建模为一个多接触、全身轨迹优化问题。通过显式地考虑刚体动力学和接触互补约束,确保生成的运动轨迹在物理上是可行的。同时,结合地面反作用力(GRF)数据,能够更准确地捕捉和复现人类的复杂接触模式。
技术框架:KDMR框架主要包含以下几个阶段:首先,输入运动捕捉数据和地面反作用力数据。然后,利用这些数据构建一个多接触全身轨迹优化问题,其中目标函数包括对运动捕捉数据的跟踪、对地面反作用力的跟踪以及对运动平滑性的约束。优化问题的约束条件包括刚体动力学约束、接触互补约束以及关节力矩限制等。最后,通过求解该优化问题,得到动态可行的全身运动轨迹。
关键创新:KDMR框架最重要的创新在于将运动重定向问题从纯粹的运动学层面提升到动力学层面。通过显式地考虑刚体动力学和接触互补约束,能够生成物理上可行的人形机器人运动轨迹。与传统的基于运动学的方法相比,KDMR能够显著减少运动伪影,提高下游控制策略的训练效果和最终性能。
关键设计:KDMR框架的关键设计包括:1) 使用多接触模型来描述人形机器人与环境之间的相互作用;2) 采用二次规划(QP)求解器来高效地求解轨迹优化问题;3) 设计合适的权重参数来平衡不同目标函数之间的关系,例如运动跟踪精度和平滑性。
🖼️ 关键图片
📊 实验亮点
实验结果表明,KDMR框架在动态可行性、GRF跟踪精度以及下游控制策略的训练效率和性能方面均优于基线方法GMR。具体来说,KDMR能够生成更加平滑和符合物理规律的运动轨迹,并且能够更准确地跟踪地面反作用力。此外,使用KDMR生成的轨迹训练的控制策略能够更快地收敛,并且具有更好的稳定性和鲁棒性。
🎯 应用场景
KDMR框架可应用于人形机器人的运动控制、动画制作、虚拟现实等领域。通过生成高质量的运动轨迹,可以提高人形机器人的运动能力和智能化水平,使其能够更好地适应复杂环境并完成各种任务。该研究对于推动人形机器人的发展具有重要的实际价值和未来影响。
📄 摘要(原文)
We present the KinoDynamic Motion Retargeting (KDMR) framework, a novel approach for humanoid locomotion that models the retargeting process as a multi-contact, whole-body trajectory optimization problem. Conventional kinematics-based retargeting methods rely solely on spatial motion capture (MoCap) data, inevitably introducing physically inconsistent artifacts, such as foot sliding and ground penetration, that severely degrade the performance of downstream imitation learning policies. To bridge this gap, KDMR extends beyond pure kinematics by explicitly enforcing rigid-body dynamics and contact complementarity constraints. Further, by integrating ground reaction force (GRF) measurements alongside MoCap data, our method automatically detects heel-toe contact events to accurately replicate complex human-like contact patterns. We evaluate KDMR against the state-of-the-art baseline, GMR, across three key dimensions: 1) the dynamic feasibility and smoothness of the retargeted motions, 2) the accuracy of GRF tracking compared to raw source data, and 3) the training efficiency and final performance of downstream control policies trained via the BeyondMimic framework. Experimental results demonstrate that KDMR significantly outperforms purely kinematic methods, yielding dynamically viable reference trajectories that accelerate policy convergence and enhance overall locomotion stability. Our end-to-end pipeline will be open-sourced upon publication.