Iterative Closed-Loop Motion Synthesis for Scaling the Capabilities of Humanoid Control

作者: Weisheng Xu, Qiwei Wu, Jiaxi Zhang, Tan Jing, Yangfan Li, Yuetong Fang, Jiaqi Xiong, Kai Wu, Rong Ou, Renjing Xu

分类: cs.RO, cs.CV

发布日期: 2026-02-25

💡 一句话要点

提出迭代闭环运动合成框架，提升物理仿真人形控制器的性能与泛化性

🎯 匹配领域: 支柱一：机器人控制 (Robot Control) 支柱四：生成式动作 (Generative Motion) 支柱七：动作重定向 (Motion Retargeting) 支柱八：物理动画 (Physics-based Animation)

关键词: 人形控制 运动合成 闭环迭代 强化学习 物理仿真

📋 核心要点

现有基于物理的人形控制受限于运动数据集的质量和规模，特别是难以获取多样且高质量的运动数据。
论文提出闭环自动运动数据生成和迭代框架，通过难度迭代策略和数据，突破原始难度限制，提升控制策略的性能。
实验表明，该框架在单原语跟踪任务上，仅使用少量数据即可显著降低失败率，验证了其有效性和优越性。

📝 摘要（中文）

基于物理的人形控制依赖于具有多样数据分布的运动数据集进行训练。然而，数据集固定的难度分布限制了训练得到的控制策略的性能上限。此外，通过专业动作捕捉系统获取高质量数据的方法受限于成本，难以实现大规模扩展。为了解决这些问题，我们提出了一种闭环自动运动数据生成和迭代框架。它可以生成具有丰富动作语义的高质量运动数据，包括武术、舞蹈、格斗、运动、体操等。此外，我们的框架通过物理指标和客观评估实现策略和数据的难度迭代，使训练后的跟踪器突破其原始难度限制。在PHC单原语跟踪器上，仅使用约AMASS数据集大小的1/10，测试集（2201个片段）上的平均失败率相比基线降低了45%。最后，我们进行了全面的消融和对比实验，以突出我们框架的合理性和优势。

🔬 方法详解

问题定义：现有基于物理的人形控制方法依赖于大量的运动捕捉数据进行训练，但高质量的运动捕捉数据获取成本高昂，且数据集的难度分布固定，限制了控制策略的泛化能力和性能上限。因此，如何低成本地生成高质量、多样化且具有难度迭代的运动数据，是本研究要解决的核心问题。

核心思路：论文的核心思路是构建一个闭环的运动数据生成和迭代框架。该框架通过自动生成运动数据，并根据控制策略在这些数据上的表现，迭代地调整数据的难度和分布，从而使控制策略能够逐步适应更复杂和多样的运动场景。这种闭环迭代的方式能够有效地突破数据集的原始难度限制，提升控制策略的性能和泛化能力。

技术框架：该框架主要包含以下几个模块：1) 运动数据生成器：负责生成具有丰富动作语义的运动数据，例如武术、舞蹈等。2) 控制策略训练器：使用生成的运动数据训练人形控制策略。3) 难度评估器：根据控制策略在运动数据上的表现，评估数据的难度。4) 难度迭代器：根据难度评估结果，调整运动数据的生成策略，生成更具挑战性的数据。整个流程形成一个闭环，通过不断迭代，提升控制策略的性能和泛化能力。

关键创新：该论文的关键创新在于提出了一个闭环的运动数据生成和迭代框架，该框架能够自动生成高质量、多样化且具有难度迭代的运动数据，从而突破数据集的原始难度限制，提升控制策略的性能和泛化能力。与传统的依赖于人工标注或运动捕捉数据的方法相比，该方法能够更低成本、更高效地生成训练数据。

关键设计：在运动数据生成器中，使用了多种动作语义模型来生成不同类型的运动数据。在难度评估器中，使用了物理指标和客观评估相结合的方式来评估数据的难度。在难度迭代器中，使用了基于强化学习的策略来调整运动数据的生成策略。此外，还设计了合适的损失函数和网络结构，以保证控制策略的训练效果。

🖼️ 关键图片

📊 实验亮点

实验结果表明，该框架在PHC单原语跟踪器上，仅使用约AMASS数据集大小的1/10，测试集（2201个片段）上的平均失败率相比基线降低了45%。这表明该框架能够有效地提升控制策略的性能，并且具有较高的训练效率。消融实验和对比实验进一步验证了该框架的合理性和优势。

🎯 应用场景

该研究成果可广泛应用于机器人控制、虚拟现实、游戏开发等领域。例如，可以用于训练人形机器人完成复杂的运动任务，提升机器人在复杂环境中的适应能力。在虚拟现实和游戏开发中，可以生成更加逼真和自然的虚拟角色运动，提升用户体验。此外，该方法还可以应用于其他类型的控制任务，例如无人驾驶、智能制造等。

📄 摘要（原文）

Physics-based humanoid control relies on training with motion datasets that have diverse data distributions. However, the fixed difficulty distribution of datasets limits the performance ceiling of the trained control policies. Additionally, the method of acquiring high-quality data through professional motion capture systems is constrained by costs, making it difficult to achieve large-scale scalability. To address these issues, we propose a closed-loop automated motion data generation and iterative framework. It can generate high-quality motion data with rich action semantics, including martial arts, dance, combat, sports, gymnastics, and more. Furthermore, our framework enables difficulty iteration of policies and data through physical metrics and objective evaluations, allowing the trained tracker to break through its original difficulty limits. On the PHC single-primitive tracker, using only approximately 1/10 of the AMASS dataset size, the average failure rate on the test set (2201 clips) is reduced by 45\% compared to the baseline. Finally, we conduct comprehensive ablation and comparative experiments to highlight the rationality and advantages of our framework.

Iterative Closed-Loop Motion Synthesis for Scaling the Capabilities of Humanoid Control

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理