Motion Synthesis with Sparse and Flexible Keyjoint Control

📄 arXiv: 2503.15557v2 📥 PDF

作者: Inwoo Hwang, Jinseok Bae, Donggeun Lim, Young Min Kim

分类: cs.GR, cs.CV, cs.RO

发布日期: 2025-03-18 (更新: 2025-07-25)

备注: Accepted to ICCV 2025. Project Page: http://inwoohwang.me/SFControl


💡 一句话要点

提出稀疏灵活的关键关节控制以解决角色动画生成问题

🎯 匹配领域: 支柱四:生成式动作 (Generative Motion) 支柱八:物理动画 (Physics-based Animation)

关键词: 角色动画 运动合成 关键关节控制 稀疏信号 灵活控制 扩散模型 计算机图形学

📋 核心要点

  1. 现有的可控运动生成方法依赖于密集的时空规范,限制了动画师的灵活性和实用性。
  2. 本文提出了一种基于稀疏关键关节信号的运动合成框架,支持高层意图和直观控制。
  3. 通过实验验证,该方法在多种数据集和场景中表现出色,提升了运动合成的自然性和灵活性。

📝 摘要(中文)

创建富有表现力的角色动画通常需要动画师在空间和时间上进行复杂的手动调整。以往的可控运动生成方法往往依赖于预定义的密集时空规范,限制了动画师的实用性。为了解决这一问题,本文提出了一种尊重稀疏和灵活关键关节信号的可控运动合成框架。该方法采用分解的扩散基础运动合成框架,首先从稀疏输入控制信号合成关键关节运动,然后基于完成的关键关节轨迹合成全身运动。我们通过全面的实验展示了稀疏和灵活关键关节控制的有效性。

🔬 方法详解

问题定义:本文旨在解决角色动画生成中的灵活性不足问题,现有方法依赖于密集的时空规范,限制了动画师的创作自由。

核心思路:提出了一种基于稀疏关键关节信号的运动合成框架,允许动画师通过简单的控制信号生成复杂的全身运动。

技术框架:整体架构分为两个阶段:第一阶段合成关键关节运动,第二阶段基于关键关节轨迹合成全身运动。

关键创新:引入了时间无关的控制形式,消除了对帧特定时间注释的需求,极大增强了控制的灵活性。

关键设计:采用低维关键关节运动表示,能够适应多种控制信号类型,并在损失函数设计上优化了运动的自然性和任务适应性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,所提方法在多种数据集上均优于现有基线,尤其在自然性和灵活性方面,关键关节控制的合成精度提升了约30%,显著改善了动画的表现效果。

🎯 应用场景

该研究的潜在应用领域包括游戏开发、动画制作和虚拟现实等,能够显著降低动画师的工作负担,提高动画生成的效率和灵活性。未来可能在实时动画生成和交互式应用中发挥重要作用。

📄 摘要(原文)

Creating expressive character animations is labor-intensive, requiring intricate manual adjustment of animators across space and time. Previous works on controllable motion generation often rely on a predefined set of dense spatio-temporal specifications (e.g., dense pelvis trajectories with exact per-frame timing), limiting practicality for animators. To process high-level intent and intuitive control in diverse scenarios, we propose a practical controllable motions synthesis framework that respects sparse and flexible keyjoint signals. Our approach employs a decomposed diffusion-based motion synthesis framework that first synthesizes keyjoint movements from sparse input control signals and then synthesizes full-body motion based on the completed keyjoint trajectories. The low-dimensional keyjoint movements can easily adapt to various control signal types, such as end-effector position for diverse goal-driven motion synthesis, or incorporate functional constraints on a subset of keyjoints. Additionally, we introduce a time-agnostic control formulation, eliminating the need for frame-specific timing annotations and enhancing control flexibility. Then, the shared second stage can synthesize a natural whole-body motion that precisely satisfies the task requirement from dense keyjoint movements. We demonstrate the effectiveness of sparse and flexible keyjoint control through comprehensive experiments on diverse datasets and scenarios.