AnchorRoute: Human Motion Synthesis with Interval-Routed Sparse Contro

📄 arXiv: 2605.14716v1 📥 PDF

作者: Pengcheng Fang, Tengjiao Sun, Dongjie Fu, Xiaoyu Zhan, Yanwen Guo, Hansung Kim, Xiaohao Cai

分类: cs.GR, cs.CV, cs.LG

发布日期: 2026-05-14


💡 一句话要点

AnchorRoute:利用区间路由稀疏控制的人体运动合成框架

🎯 匹配领域: 支柱四:生成式动作 (Generative Motion) 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 人体运动合成 稀疏控制 锚点控制 扩散模型 运动生成

📋 核心要点

  1. 现有方法在稀疏控制人体运动合成中,难以兼顾运动质量和对用户指定锚点的精确控制。
  2. AnchorRoute框架通过锚点条件生成和残差路由细化,实现了高质量和高精度的人体运动合成。
  3. 实验表明,AnchorRoute在稀疏关键点控制上优于现有方法,并显著提升了对各类锚点控制的依从性。

📝 摘要(中文)

AnchorRoute是一个稀疏锚点运动合成框架,它使用锚点作为生成和细化的共享支架。在生成之前,AnchorRoute将稀疏锚点转换为锚点条件特征,并通过AnchorKV和双上下文条件将生成的条件记忆注入到冻结的Transition Masked Diffusion先验中。这保留了预训练的文本到运动先验的生成质量,同时学习稀疏空间控制。生成后,相同的锚点被评估为残差:它们的时间戳定义了细化间隔,它们的残差决定了应该集中校正的位置。然后,RouteSolver通过将软令牌更新投影到锚点定义的逐段仿射区间基上来细化运动。这在单个锚点支架下将生成时锚点条件与残差路由细化相结合。AnchorRoute在同一公式中支持根3D、平面根和身体点控制。在基准评估中,AnchorRoute在稀疏关键点协议下优于先前的稀疏控制方法,并始终提高跨控制系列的锚点依从性。结果表明,学习到的锚点条件生成器和RouteSolver细化是互补的:生成器保留了文本运动质量,而RouteSolver提供了通往更强锚点依从性的可控路径。

🔬 方法详解

问题定义:论文旨在解决在稀疏锚点控制下的人体运动合成问题。现有的方法通常难以在保持运动自然性和精确遵循用户指定的稀疏锚点约束之间取得平衡。一些方法可能生成流畅的运动,但无法准确地匹配锚点位置,而另一些方法可能过度拟合锚点,导致运动不自然或不稳定。

核心思路:AnchorRoute的核心思路是将锚点作为运动生成和细化的统一接口。首先,利用锚点信息引导运动的生成过程,确保生成的运动初步满足锚点约束。然后,通过残差路由细化,对生成的运动进行局部调整,进一步提高锚点依从性。这种生成和细化相结合的策略,旨在兼顾运动的自然性和锚点约束的精确性。

技术框架:AnchorRoute框架包含两个主要阶段:锚点条件生成和残差路由细化。在生成阶段,稀疏锚点被转换为锚点条件特征,并注入到预训练的Transition Masked Diffusion模型中,以引导运动生成。在细化阶段,通过RouteSolver模块,根据锚点残差对生成的运动进行局部调整,提高锚点依从性。AnchorKV模块和双上下文条件用于将锚点信息有效地融入到扩散模型中。

关键创新:AnchorRoute的关键创新在于将锚点同时用于运动生成和细化,形成一个统一的锚点控制框架。通过AnchorKV和双上下文条件,有效地将锚点信息融入到扩散模型中,实现了锚点条件生成。RouteSolver模块通过残差路由细化,进一步提高了锚点依从性。这种生成和细化相结合的策略,是AnchorRoute区别于现有方法的本质特征。

关键设计:AnchorRoute的关键设计包括:1) AnchorKV模块,用于将锚点信息编码为键值对,并注入到扩散模型中;2) 双上下文条件,同时利用文本描述和锚点信息引导运动生成;3) RouteSolver模块,通过将软令牌更新投影到锚点定义的逐段仿射区间基上来细化运动。损失函数的设计旨在平衡运动的自然性和锚点依从性,具体细节未知。

🖼️ 关键图片

fig_0
img_1

📊 实验亮点

AnchorRoute在稀疏关键点控制协议下,优于现有的稀疏控制方法。实验结果表明,AnchorRoute能够显著提高对各类锚点控制的依从性,同时保持运动的自然性。具体的性能提升数据未知,但论文强调了AnchorRoute在不同控制方式下的一致性改进。

🎯 应用场景

AnchorRoute可应用于动画制作、游戏开发、虚拟现实等领域,允许用户通过少量关键帧或目标点来控制人物运动,极大地简化了运动生成流程。该技术还可用于机器人控制,通过指定机器人的关键姿态,生成完整的运动轨迹。未来,AnchorRoute有望成为人机交互的重要工具,实现更加自然和直观的运动控制。

📄 摘要(原文)

Sparse anchors provide a compact interface for human motion authoring: users specify a few root positions, planar trajectory samples, or body-point targets, while the system synthesizes the full-body motion that completes the under-specified intent. We present AnchorRoute, a sparse-anchor motion synthesis framework that uses anchors as a shared scaffold for both generation and refinement. Before generation, AnchorRoute converts sparse anchors into anchor-condition features and injects the resulting condition memory into a frozen Transition Masked Diffusion prior through AnchorKV and dual-context conditioning. This preserves the generation quality of the pretrained text-to-motion prior while learning sparse spatial control. After generation, the same anchors are evaluated as residuals: their timestamps define refinement intervals, and their residuals determine where correction should be concentrated. RouteSolver then refines the motion by projecting soft-token updates onto anchor-defined piecewise-affine interval bases. This couples generation-time anchor conditioning with residual-routed refinement under one anchor scaffold. AnchorRoute supports root-3D, planar-root, and body-point control within the same formulation. In benchmark evaluations, AnchorRoute outperforms prior sparse-control methods under the sparse keyjoint protocol and consistently improves anchor adherence across control families. The results show that the learned anchor-conditioned generator and RouteSolver refinement are complementary: the generator preserves text-motion quality, while RouteSolver provides a controllable path toward stronger anchor adherence.