Self-Intersection-Aware 3D Human Motion Generation Using an Efficient Human Sphere Proxy
作者: Pascal Herrmann, Maarten Bieshaar, Dennis Mack, Robert Herzog, Juergen Gall
分类: cs.CV
发布日期: 2026-05-26
备注: Accepted to BMVC 2025
🔗 代码/项目: GITHUB
💡 一句话要点
提出基于高效人体球体代理的自相交感知3D人体运动生成方法
🎯 匹配领域: 支柱四:生成式动作 (Generative Motion) 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)
关键词: 人体运动生成 自相交检测 球体代理 深度学习 运动扩散模型
📋 核心要点
- 现有的人体运动生成方法,即使是最先进的,也经常产生包含自相交的运动,影响运动质量。
- 论文提出使用人体球体代理来计算自相交损失,该方法比基于三角网格的方法更高效,减少计算时间和内存占用。
- 通过将该损失函数添加到MDM和MoMask的训练中,显著减少了生成运动中的自相交,并提升了其他性能指标。
📝 摘要(中文)
近年来,人体运动生成取得了显著进展,但现有方法生成的运动经常包含自相交伪影,严重限制了运动质量。本文提出了一种新的损失函数,显式惩罚自相交,用于训练人体运动生成模型。该损失函数基于人体几何体的球体代理,与基于三角网格的同类方法相比,计算自相交损失的速度提高了98%,内存使用量减少了83%。该损失函数与具体方法无关,可添加到现有的人体运动生成方法(如MDM和MoMask)的训练中。大量实验表明,生成的运动中的自相交减少了高达49%,同时还改善了其他评估指标。
🔬 方法详解
问题定义:现有的人体运动生成方法,虽然在一些评估指标上表现出色,但生成的运动中经常出现身体部位相互穿透的自相交现象。这些自相交是明显的伪影,严重降低了生成运动的真实感和可用性。因此,如何减少甚至消除人体运动生成中的自相交问题是一个重要的挑战。
核心思路:论文的核心思路是设计一个能够有效惩罚自相交的损失函数,并将其集成到现有的人体运动生成模型的训练过程中。为了提高计算效率,论文没有直接使用复杂的人体网格模型,而是采用了一个简化的球体代理来近似人体几何形状。通过计算球体之间的穿透程度来估计自相交的严重程度,并以此作为损失函数的依据。
技术框架:整体框架是在现有的运动生成模型(如MDM或MoMask)的训练过程中,增加一个自相交损失项。具体流程如下:1)使用运动生成模型生成人体运动序列;2)将人体运动序列转换为球体代理表示;3)计算球体之间的穿透程度,得到自相交损失;4)将自相交损失与原模型的损失函数加权求和,得到总损失;5)使用总损失更新模型参数。
关键创新:最重要的技术创新点在于使用球体代理来近似人体几何形状,从而大幅提高了自相交损失的计算效率。与直接使用三角网格模型相比,球体代理的计算复杂度更低,更易于并行化。此外,该损失函数的设计具有通用性,可以方便地集成到不同的运动生成模型中。
关键设计:论文的关键设计包括:1)球体代理的构建方式:如何选择球体的数量、大小和位置,以尽可能准确地近似人体几何形状;2)穿透程度的计算方法:如何定义球体之间的穿透程度,并将其转化为可微的损失函数;3)损失函数的加权系数:如何平衡自相交损失与原模型损失之间的权重,以避免过度惩罚自相交而影响运动的自然性。
🖼️ 关键图片
📊 实验亮点
实验结果表明,使用该方法后,生成运动中的自相交减少了高达49%,同时在某些情况下还改善了FID等其他评估指标。与基于三角网格的方法相比,该方法计算自相交损失的速度提高了98%,内存使用量减少了83%。这些结果表明,该方法在减少自相交的同时,保持了较高的计算效率和良好的运动质量。
🎯 应用场景
该研究成果可应用于虚拟现实、游戏开发、动画制作等领域,提升虚拟角色的运动真实感和视觉质量。通过减少自相交伪影,可以改善用户体验,并为更逼真的人机交互提供技术支持。此外,该方法还可以应用于机器人运动规划,避免机器人与自身或环境发生碰撞。
📄 摘要(原文)
Human motion generation has made tremendous progress in recent years, with state-of-the-art approaches surpassing ground truth data in leading evaluation benchmarks. However, visual inspection of the generated motions paints a different picture. Even state-of-the-art approaches generate motions frequently containing self-intersections, i.e., body parts interpenetrating, which are strong artifacts, severely limiting the perceived motion quality. We introduce a novel loss, which explicitly penalizes self-intersections, to the training of human motion generation methods. We base our loss on a sphere proxy of human geometry, which allows us to calculate a self-intersection loss 98% faster and uses 83% less memory than comparable methods based on triangular meshes. The loss is agnostic to the specific approach, and we add it to the training of the recent human motion generation methods human motion diffusion model (MDM) and MoMask. Our extensive experiments show a reduction of self-intersections in generated motions of up to 49% while improving other evaluation metrics. The code is available at https://github.com/boschresearch/humansphereproxy .