SPARK: Skeleton-Parameter Aligned Retargeting on Humanoid Robots with Kinodynamic Trajectory Optimization

📄 arXiv: 2603.11480v1 📥 PDF

作者: Hanwen Wang, Qiayuan Liao, Bike Zhang, Kunzhao Ren, Koushil Sreenath, Xiaobin Xiong

分类: cs.RO

发布日期: 2026-03-12


💡 一句话要点

SPARK:基于骨骼参数对齐和运动动力学轨迹优化的人形机器人动作重定向

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)

关键词: 人形机器人 动作重定向 骨骼参数对齐 运动动力学 轨迹优化 运动技能学习 人机协作

📋 核心要点

  1. 现有方法难以直接将人体运动应用于人形机器人,因为人体演示与机器人的运动学和动力学特性不兼容。
  2. SPARK通过骨骼参数对齐和运动动力学轨迹优化,将人体运动转化为机器人可执行的自然且动力学可行的运动参考。
  3. 该方法通过骨骼校准减少逆运动学误差,并通过渐进式轨迹优化生成动态一致的轨迹和关节扭矩曲线。

📝 摘要(中文)

本文提出了一种两阶段流程,用于从任务空间的人体运动数据生成自然且动力学可行的机器人运动参考。首先,将人体运动转换为基于URDF的统一机器人描述格式的骨骼表示,并将其校准到目标人形机器人的尺寸。通过对齐底层骨骼结构而非启发式地修改任务空间目标,此步骤显著减少了逆运动学误差和调整工作。其次,通过渐进式运动动力学轨迹优化(TO)细化重定向后的轨迹,该优化分三个阶段求解:运动学TO、逆动力学和完整运动动力学TO,每个阶段都从前一个解决方案热启动。最终结果产生动态一致的状态轨迹和关节扭矩曲线,为基于学习的控制器提供高质量的参考。骨骼校准和运动动力学TO共同实现了在各种人形机器人平台上生成自然、物理一致的运动参考。

🔬 方法详解

问题定义:现有方法直接将人体运动应用于人形机器人时,由于两者在运动学和动力学上的差异,会导致逆运动学误差大,需要大量人工调整,且生成的运动不符合机器人的动力学约束,无法直接作为控制器的参考。因此,需要一种方法能够将人体运动转化为机器人可执行的、自然且动力学可行的运动参考。

核心思路:SPARK的核心思路是首先通过骨骼参数对齐,将人体运动映射到机器人的骨骼结构上,减少运动学上的差异。然后,通过渐进式的运动动力学轨迹优化,逐步引入动力学约束,生成满足机器人动力学特性的运动轨迹。这种分阶段优化的方式可以提高优化效率和稳定性。

技术框架:SPARK包含两个主要阶段:骨骼参数对齐和运动动力学轨迹优化。骨骼参数对齐阶段将人体运动转换为基于URDF的机器人骨骼表示,并进行尺寸校准。运动动力学轨迹优化阶段分为三个子阶段:运动学轨迹优化、逆动力学和完整运动动力学轨迹优化。每个子阶段都以前一个阶段的解作为初始值,逐步增加约束条件,最终生成动态一致的轨迹和关节扭矩曲线。

关键创新:SPARK的关键创新在于骨骼参数对齐和渐进式运动动力学轨迹优化。骨骼参数对齐通过对齐底层骨骼结构,避免了直接修改任务空间目标,从而减少了逆运动学误差和调整工作。渐进式运动动力学轨迹优化通过分阶段优化,逐步引入动力学约束,提高了优化效率和稳定性。

关键设计:骨骼参数对齐的关键在于找到合适的骨骼映射关系和尺寸缩放比例。运动动力学轨迹优化采用序列二次规划(SQP)求解器,并设计了合适的代价函数,包括位置跟踪误差、速度跟踪误差、力矩约束等。每个优化阶段都使用前一阶段的解作为初始值,以加速收敛。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文提出的SPARK方法在人形机器人上实现了自然且动力学可行的运动重定向。通过骨骼参数对齐,显著减少了逆运动学误差和人工调整工作。渐进式运动动力学轨迹优化生成了动态一致的轨迹和关节扭矩曲线,为学习型控制器提供了高质量的参考。具体性能数据和与其他方法的对比结果未知。

🎯 应用场景

该研究成果可应用于人形机器人的运动技能学习、人机协作、远程操作等领域。通过将人类的运动经验迁移到机器人上,可以快速生成各种复杂的机器人运动技能,提高机器人的智能化水平和应用范围。例如,可以让人形机器人模仿人类的舞蹈动作、运动姿态,或者在危险环境中进行远程操作。

📄 摘要(原文)

Human motion provides rich priors for training general-purpose humanoid control policies, but raw demonstrations are often incompatible with a robot's kinematics and dynamics, limiting their direct use. We present a two-stage pipeline for generating natural and dynamically feasible motion references from task-space human data. First, we convert human motion into a unified robot description format (URDF)-based skeleton representation and calibrate it to the target humanoid's dimensions. By aligning the underlying skeleton structure rather than heuristically modifying task-space targets, this step significantly reduces inverse kinematics error and tuning effort. Second, we refine the retargeted trajectories through progressive kinodynamic trajectory optimization (TO), solved in three stages: kinematic TO, inverse dynamics, and full kinodynamic TO, each warm-started from the previous solution. The final result yields dynamically consistent state trajectories and joint torque profiles, providing high-quality references for learning-based controllers. Together, skeleton calibration and kinodynamic TO enable the generation of natural, physically consistent motion references across diverse humanoid platforms.