BRIC: Bridging Kinematic Plans and Physical Control at Test Time

📄 arXiv: 2511.20431v2 📥 PDF

作者: Dohun Lim, Minji Kim, Jaewoon Lim, Sungchan Kim

分类: cs.CV, cs.RO

发布日期: 2025-11-25 (更新: 2025-11-26)

备注: Accepted to AAAI'26


💡 一句话要点

BRIC:桥接运动规划与物理控制的测试时自适应框架

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱四:生成式动作 (Generative Motion) 支柱五:交互与反应 (Interaction & Reaction)

关键词: 测试时自适应 运动规划 物理控制 扩散模型 强化学习 人体运动生成 人机交互

📋 核心要点

  1. 现有方法难以弥合运动规划器和物理控制器之间的差距,导致模拟执行中出现漂移,影响长期运动生成。
  2. BRIC通过测试时自适应策略,动态调整物理控制器并引导扩散模型,以适应噪声运动计划,确保物理合理性。
  3. 实验表明,BRIC在运动组合、避障和人机交互等任务中均取得了领先性能,验证了其有效性和泛化能力。

📝 摘要(中文)

本文提出BRIC,一种新颖的测试时自适应(TTA)框架,旨在解决基于扩散的运动规划器和基于强化学习的物理控制器之间执行差异,从而实现长期人体运动生成。虽然扩散模型可以生成多样且富有表现力的、以文本和场景上下文为条件的运动,但它们通常产生物理上不合理的输出,导致模拟过程中的执行漂移。为了解决这个问题,BRIC在测试时动态地调整物理控制器以适应有噪声的运动计划,同时通过减轻灾难性遗忘的损失函数来保留预训练的技能。此外,BRIC引入了一种轻量级的测试时引导机制,可以在信号空间中引导扩散模型,而无需更新其参数。通过结合这两种自适应策略,BRIC以有效和高效的方式确保了在各种环境中一致且物理上合理的长期执行。我们在各种长期任务(包括运动组合、避障和人机交互)上验证了BRIC的有效性,并在所有任务中实现了最先进的性能。

🔬 方法详解

问题定义:论文旨在解决扩散模型生成的运动规划在物理模拟中执行时产生的漂移问题。扩散模型虽然能生成多样的运动,但其输出往往不符合物理规律,导致在物理引擎中模拟时,角色会偏离预定的运动轨迹。现有方法难以有效地将运动规划器的输出与物理控制器对齐,尤其是在长期运动生成任务中。

核心思路:BRIC的核心思路是在测试时动态地调整物理控制器和引导扩散模型,使其相互适应。通过这种方式,BRIC能够弥合运动规划和物理控制之间的差距,从而实现物理上合理且连贯的长期运动生成。这种自适应方法避免了对扩散模型或物理控制器的重新训练,提高了效率和灵活性。

技术框架:BRIC框架包含两个主要组成部分:测试时物理控制器自适应和测试时扩散模型引导。首先,物理控制器通过一个损失函数进行微调,该损失函数旨在最小化目标运动和实际运动之间的差异,同时保留预训练的技能。其次,扩散模型通过一个轻量级的引导机制进行调整,该机制在信号空间中引导扩散过程,使其生成更符合物理规律的运动。这两个过程协同工作,确保运动规划和物理控制的一致性。

关键创新:BRIC的关键创新在于其测试时自适应策略,它允许在不重新训练模型的情况下,动态地调整物理控制器和引导扩散模型。这种方法避免了灾难性遗忘问题,并提高了模型的泛化能力。此外,BRIC引入的轻量级引导机制能够在信号空间中有效地引导扩散模型,而无需更新其参数,从而提高了效率。

关键设计:BRIC使用一个损失函数来微调物理控制器,该损失函数包含两项:一项用于最小化目标运动和实际运动之间的差异,另一项用于保留预训练的技能。扩散模型的引导机制通过在扩散过程中添加一个梯度项来实现,该梯度项指向更符合物理规律的方向。具体参数设置(如学习率、损失函数权重等)在论文中有详细描述,以确保最佳性能。

📊 实验亮点

BRIC在运动组合、避障和人机交互等长期任务中取得了显著的性能提升,超越了现有最先进的方法。实验结果表明,BRIC能够生成更连贯、更自然的运动,并且在物理模拟中表现出更好的稳定性。具体性能数据在论文中有详细展示,包括各种指标的量化比较。

🎯 应用场景

BRIC技术可应用于虚拟现实、游戏开发、机器人控制等领域。它能够生成更逼真、更自然的虚拟角色运动,提高用户体验。在机器人控制中,BRIC可以帮助机器人更好地适应复杂环境,完成各种任务。此外,该技术还可用于运动分析和康复训练等领域。

📄 摘要(原文)

We propose BRIC, a novel test-time adaptation (TTA) framework that enables long-term human motion generation by resolving execution discrepancies between diffusion-based kinematic motion planners and reinforcement learning-based physics controllers. While diffusion models can generate diverse and expressive motions conditioned on text and scene context, they often produce physically implausible outputs, leading to execution drift during simulation. To address this, BRIC dynamically adapts the physics controller to noisy motion plans at test time, while preserving pre-trained skills via a loss function that mitigates catastrophic forgetting. In addition, BRIC introduces a lightweight test-time guidance mechanism that steers the diffusion model in the signal space without updating its parameters. By combining both adaptation strategies, BRIC ensures consistent and physically plausible long-term executions across diverse environments in an effective and efficient manner. We validate the effectiveness of BRIC on a variety of long-term tasks, including motion composition, obstacle avoidance, and human-scene interaction, achieving state-of-the-art performance across all tasks.