Any2Any: Efficient Cross-Embodiment Transfer for Humanoid Whole-Body Tracking
作者: Ming Yang, Tao Yu, Feng Li, Hua Chen
分类: cs.RO, cs.AI
发布日期: 2026-05-22
💡 一句话要点
Any2Any:高效的人形机器人全身跟踪跨形态迁移方法
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱七:动作重定向 (Motion Retargeting)
关键词: 全身跟踪 跨形态迁移 人形机器人 运动学对齐 动力学自适应
📋 核心要点
- 人形机器人全身跟踪模型训练需要大量数据和算力,难以快速部署到新的机器人平台上。
- Any2Any通过运动学对齐和动力学自适应,实现预训练模型在不同机器人形态间的迁移。
- 实验表明,Any2Any仅用少量数据和算力即可实现优越的跟踪性能,加速了模型部署。
📝 摘要(中文)
全身跟踪(WBT)模型已成为人形机器人的关键基础,使其能够高保真地模仿各种运动。从头开始训练此类模型需要大规模的数据和计算,这使得在新的人形平台上快速部署的成本很高。这引出了一个自然的问题:预训练的WBT模型能否以最小的适应性跨形态迁移?为了回答这个问题,我们提出了Any2Any,这是一种只需少量数据和计算即可将现有WBT专家高效迁移到新的人形形态的范例。Any2Any首先在源人形和目标人形之间执行运动学对齐,对齐它们的输入和输出空间,以便预训练的源策略可以在目标形态上有意义地重用。然后,Any2Any通过将轻量级的参数高效微调(PEFT)组件应用于选定的动力学敏感模块来执行动力学适应,保留有用的行为先验,同时实现对目标机器人的有针对性的适应。在多个人形平台和预训练骨干网络上的大量实验表明,与从头开始训练相比,Any2Any显著加速了收敛并降低了训练成本,同时实现了有竞争力或更优越的跟踪性能。值得注意的是,仅使用完整训练所需的1%的计算和数据,Any2Any成功地将预训练在Unitree G1上的Sonic模型迁移到LimX Oli和LimX Luna。这些结果表明,预训练的WBT专家可以在不同的形态之间高效地重用,从而为在新机器人上部署人形全身控制提供了一条可扩展的路径。
🔬 方法详解
问题定义:论文旨在解决人形机器人全身跟踪(WBT)模型在不同机器人形态之间迁移的问题。现有方法通常需要从头开始训练新的WBT模型,这需要大量的数据和计算资源,使得在新的机器人平台上快速部署WBT模型变得非常困难。
核心思路:论文的核心思路是利用预训练的WBT模型,通过运动学对齐和动力学自适应,将其迁移到新的机器人形态上。运动学对齐用于对齐不同机器人形态的输入和输出空间,使得预训练的策略可以在新的机器人上直接使用。动力学自适应则通过轻量级的参数高效微调(PEFT)来调整模型的动力学特性,使其适应新的机器人。
技术框架:Any2Any的整体框架包括两个主要阶段:运动学对齐和动力学自适应。首先,对源机器人和目标机器人进行运动学对齐,包括关节角度范围、连杆长度等。然后,将预训练的源机器人WBT模型迁移到目标机器人,并使用PEFT方法对模型的动力学敏感模块进行微调,以适应目标机器人的动力学特性。
关键创新:Any2Any的关键创新在于提出了一种高效的跨形态迁移方法,该方法结合了运动学对齐和动力学自适应,可以在少量数据和计算资源的情况下,将预训练的WBT模型迁移到新的机器人形态上。与从头开始训练相比,Any2Any大大降低了训练成本,并提高了模型的部署效率。
关键设计:在运动学对齐方面,论文采用了基于优化的方法来对齐源机器人和目标机器人的关节角度范围和连杆长度。在动力学自适应方面,论文使用了轻量级的PEFT方法,例如Adapter和LoRA,只对模型的少量参数进行微调,从而避免了过拟合,并保留了预训练模型的泛化能力。损失函数包括跟踪误差、关节力矩误差等。
🖼️ 关键图片
📊 实验亮点
实验结果表明,Any2Any在多个人形机器人平台(如LimX Oli和LimX Luna)上实现了优越的全身跟踪性能。与从头开始训练相比,Any2Any仅使用1%的计算和数据即可达到相当甚至更优的性能,显著降低了训练成本和时间。例如,成功将Unitree G1上预训练的Sonic模型迁移到LimX Oli和LimX Luna。
🎯 应用场景
Any2Any技术可广泛应用于人形机器人的快速部署和控制。例如,可以将预训练的WBT模型快速迁移到不同型号的人形机器人上,从而加速机器人的研发和应用。此外,该技术还可以用于机器人的运动技能学习和模仿学习,使得机器人能够快速学习新的运动技能。
📄 摘要(原文)
Whole-body tracking (WBT) models have become a key foundation for humanoid robots, enabling them to imitate diverse motions with high fidelity. Training such models from scratch requires large-scale data and computation, making rapid deployment on new humanoid platforms costly. This raises a natural question: Can pretrained WBT models transfer across embodiments with minimal adaptation? To answer this question, we propose Any2Any, a paradigm that efficiently transfers an existing WBT specialist to a new humanoid embodiment with only a small amount of data and compute. Any2Any first performs kinematic alignment between source and target humanoids, aligning their input and output spaces so that the pretrained source policy can be meaningfully reused on the target embodiment.Any2Any then performs dynamics adaptation by applying lightweight parameter-efficient fine-tuning (PEFT) components to selected dynamics-sensitive modules, preserving useful behavioral priors while enabling targeted adaptation to the target robot. Extensive experiments on multiple humanoid platforms and pretrained backbones show that Any2Any substantially accelerates convergence and reduces training cost compared with training from scratch, while achieving competitive or superior tracking performance. Notably, using only 1% of the compute and data required for full training, Any2Any successfully transfers Sonic models pre-trained on Unitree G1 to LimX Oli and LimX Luna. These results suggest that pretrained WBT specialists can be efficiently reused across embodiments, providing a scalable path toward deploying humanoid whole-body control on new robots.