Track Any Motions under Any Disturbances
作者: Zhikai Zhang, Jun Guo, Chao Chen, Jilong Wang, Chenghuai Lin, Yunrui Lian, Han Xue, Zhenrong Wang, Maoqi Liu, Jiangran Lyu, Huaping Liu, He Wang, Li Yi
分类: cs.RO
发布日期: 2025-09-17 (更新: 2025-09-30)
💡 一句话要点
Any2Track:强化学习框架,实现人形机器人复杂运动和抗扰动追踪
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 人形机器人 运动追踪 强化学习 动态自适应 sim2real 扰动鲁棒性 机器人控制
📋 核心要点
- 现有方法难以使人形机器人在复杂地形和扰动下稳定追踪多样化运动,限制了其通用性。
- Any2Track框架包含AnyTracker和AnyAdapter,分别负责运动追踪和动态自适应,提升了鲁棒性。
- 在宇树G1机器人上的实验表明,Any2Track能够零样本迁移到真实环境,并在多种扰动下表现出色。
📝 摘要(中文)
本文提出Any2Track,一个两阶段强化学习框架,旨在实现人形机器人在各种扰动下追踪多样化、高动态和富含接触的运动。一个基础的人形运动追踪器需要能够追踪各种运动,更重要的是,它需要在真实场景中稳定运行,以应对各种动态扰动,包括地形、外力和物理属性变化,从而实现通用实用性。Any2Track将动态适应性重新定义为基本动作执行之外的附加能力,由两个关键组件组成:AnyTracker和AnyAdapter。AnyTracker是一个通用运动追踪器,通过一系列精心设计,可以在单个策略中追踪各种运动。AnyAdapter是一个历史信息自适应模块,使追踪器具有在线动态适应性,以克服sim2real差距和多种真实世界的扰动。我们在宇树G1硬件上部署了Any2Track,并以零样本方式实现了成功的sim2real迁移。Any2Track在各种真实世界的扰动下追踪各种运动方面表现出色。
🔬 方法详解
问题定义:现有的人形机器人运动追踪器难以在真实世界的复杂环境中稳定工作,尤其是在面对地形变化、外部干扰和自身物理属性变化时。这些因素导致了模拟环境和真实环境之间的差距(sim2real gap),使得在模拟环境中训练的策略难以直接应用于真实机器人。现有的方法通常难以同时处理多样化的运动和各种扰动,限制了其通用性和实用性。
核心思路:Any2Track的核心思路是将运动追踪和动态自适应解耦为两个独立的模块:AnyTracker和AnyAdapter。AnyTracker负责学习通用的运动追踪策略,使其能够处理多种不同的运动模式。AnyAdapter则负责根据历史信息在线调整策略,以适应真实世界中的各种扰动和sim2real gap。这种解耦的设计使得系统能够更好地应对复杂环境中的挑战。
技术框架:Any2Track是一个两阶段的强化学习框架。第一阶段是训练AnyTracker,使其能够追踪各种不同的运动。第二阶段是训练AnyAdapter,使其能够根据历史信息调整AnyTracker的策略,以适应真实世界中的各种扰动。AnyTracker和AnyAdapter共同构成了一个完整的运动追踪系统。整体流程是,首先AnyTracker根据当前状态输出动作,然后AnyAdapter根据历史状态和动作调整AnyTracker的输出,最后将调整后的动作发送给机器人执行。
关键创新:Any2Track的关键创新在于将动态自适应能力作为运动追踪的附加能力,并设计了AnyAdapter模块来实现这一目标。AnyAdapter能够根据历史信息在线调整策略,从而克服sim2real gap和各种真实世界的扰动。这种设计使得Any2Track能够在各种复杂环境中稳定工作,而无需进行大量的真实环境训练。此外,AnyTracker的设计也考虑了运动的多样性,使其能够追踪各种不同的运动模式。
关键设计:AnyTracker采用了精心设计的奖励函数和状态表示,以鼓励机器人学习通用的运动追踪策略。AnyAdapter则采用了循环神经网络(RNN)来建模历史信息,并使用强化学习来训练其调整策略的能力。具体的参数设置和网络结构细节在论文中进行了详细描述。损失函数的设计也考虑了运动追踪的准确性和稳定性,以及对扰动的鲁棒性。
🖼️ 关键图片
📊 实验亮点
Any2Track在宇树G1机器人上实现了零样本sim2real迁移,并在多种真实世界扰动下表现出色。实验结果表明,Any2Track能够有效地克服sim2real gap,并在各种复杂环境中稳定工作。具体的性能数据和对比基线在论文中进行了详细展示,证明了Any2Track的优越性。
🎯 应用场景
Any2Track技术可应用于人形机器人在复杂环境下的导航、搜索救援、工业巡检等领域。它能够提升机器人在非结构化环境中的适应性和稳定性,使其能够更好地完成各种任务。未来,该技术有望推动人形机器人在更多实际场景中的应用,例如家庭服务、医疗辅助等。
📄 摘要(原文)
A foundational humanoid motion tracker is expected to be able to track diverse, highly dynamic, and contact-rich motions. More importantly, it needs to operate stably in real-world scenarios against various dynamics disturbances, including terrains, external forces, and physical property changes for general practical use. To achieve this goal, we propose Any2Track (Track Any motions under Any disturbances), a two-stage RL framework to track various motions under multiple disturbances in the real world. Any2Track reformulates dynamics adaptability as an additional capability on top of basic action execution and consists of two key components: AnyTracker and AnyAdapter. AnyTracker is a general motion tracker with a series of careful designs to track various motions within a single policy. AnyAdapter is a history-informed adaptation module that endows the tracker with online dynamics adaptability to overcome the sim2real gap and multiple real-world disturbances. We deploy Any2Track on Unitree G1 hardware and achieve a successful sim2real transfer in a zero-shot manner. Any2Track performs exceptionally well in tracking various motions under multiple real-world disturbances.