Ultra Diffusion Poser: Diffusion-Based Human Motion Tracking From Sparse Inertial Sensors and Ranging-Based Between-Sensor Distances
作者: Dominik Hollidt, Tommaso Bendinelli, Christian Holz
分类: cs.CV, cs.GR
发布日期: 2026-06-01
备注: CVPR 2026 - Computer Vision and Pattern Recognition
期刊: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2026, pp. 7036-7046
💡 一句话要点
Ultra Diffusion Poser:结合稀疏惯性传感器与测距信息的扩散人体运动追踪
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)
关键词: 人体运动追踪 扩散模型 惯性传感器 超宽带测距 姿态估计
📋 核心要点
- 现有基于惯性传感器的运动捕捉方法易受漂移影响,而集成超宽带测距的稀疏惯性姿态估计器可以缓解这一问题。
- Ultra Diffusion Poser利用扩散模型,显式建模传感器间的几何约束,通过空间布局模块重建3D传感器位置。
- 通过UWB-Diffusion Guidance,模型在扩散采样时鼓励预测姿态与测量的传感器间距离对齐,显著提升了姿态估计精度。
📝 摘要(中文)
本文提出了一种基于扩散模型的Ultra Diffusion Poser,用于从稀疏惯性测量单元(IMU)和基于超宽带(UWB)测距的传感器间距离中进行人体运动追踪。为缓解IMU信号的漂移,该方法集成了UWB测量的传感器间距离。与以往仅将UWB距离作为附加输入特征的方法不同,本文显式地利用这些距离所施加的物理约束来重建3D传感器布局,从而为姿态重建提供更具信息量的输入。该模型包含一个空间布局模块,用于从UWB测量中解析地重建3D传感器位置。这些传感器位置与IMU信号和UWB距离一起作为扩散过程中的条件信号。此外,为了解决网络预测可能违反传感器间距离测量的问题,本文引入了UWB-Diffusion Guidance,在扩散采样过程中鼓励预测姿态与测量距离对齐。实验结果表明,该方法达到了最先进的性能,关节位置误差比现有方法降低了高达22%。
🔬 方法详解
问题定义:现有的基于稀疏IMU和UWB测距的运动捕捉方法,通常只是将UWB距离作为额外的输入特征,而忽略了UWB距离所蕴含的传感器空间布局的物理约束。这种处理方式未能充分利用UWB信息,导致姿态估计精度受限。
核心思路:本文的核心思路是显式地利用UWB距离信息来重建传感器的3D空间布局,并将该布局作为姿态估计的先验知识。通过将传感器布局信息融入到扩散模型中,可以更有效地约束姿态估计过程,从而提高精度。此外,还通过UWB-Diffusion Guidance来保证预测的姿态与UWB测量的距离一致。
技术框架:Ultra Diffusion Poser包含以下几个主要模块:1) 空间布局模块:从UWB距离测量中解析地重建3D传感器位置。2) 扩散模型:以IMU信号、UWB距离和重建的传感器位置作为条件,预测人体姿态。3) UWB-Diffusion Guidance:在扩散采样过程中,通过梯度引导,鼓励预测的姿态与UWB测量的距离保持一致。整体流程是先利用空间布局模块获得传感器位置,然后将传感器位置、IMU信号和UWB距离作为扩散模型的输入,最后通过UWB-Diffusion Guidance优化采样过程。
关键创新:本文最重要的创新点在于:1) 显式地建模和利用了UWB距离所蕴含的传感器空间布局信息。2) 提出了UWB-Diffusion Guidance,在扩散采样过程中强制执行UWB距离约束。与现有方法相比,本文的方法能够更有效地利用UWB信息,从而提高姿态估计的精度。
关键设计:空间布局模块采用解析方法从UWB距离中重建传感器位置。扩散模型采用标准的扩散模型架构,并使用IMU信号、UWB距离和传感器位置作为条件输入。UWB-Diffusion Guidance通过计算预测姿态下传感器间距离与实际UWB测量距离的差异,并利用该差异的梯度来引导扩散采样过程。损失函数包括扩散模型的标准损失函数和UWB距离约束损失函数。
🖼️ 关键图片
📊 实验亮点
实验结果表明,Ultra Diffusion Poser在人体运动追踪任务上取得了state-of-the-art的性能,关节位置误差比现有方法降低了高达22%。这表明该方法能够更有效地利用稀疏惯性传感器和UWB测距信息,实现更准确的运动捕捉。
🎯 应用场景
该研究成果可应用于虚拟现实、增强现实、运动康复、体育训练等领域。通过穿戴少量惯性传感器和UWB标签,即可实现高精度的全身运动捕捉,无需复杂的摄像系统,具有便携性和易用性。未来可进一步扩展到更复杂的运动场景和更多类型的人体运动分析。
📄 摘要(原文)
Methods using inertial measurement units (IMUs) provide a wearable alternative to camera-based motion capture. To mitigate drift from inertial signals, recent sparse inertial pose estimators integrate inter-sensor distances measured by ultra-wideband (UWB) ranging. So far, UWB distances have only been used as an additional input feature, ignoring the physical constraints they impose on sensor positions. However, these distances can also be used to reconstruct the underlying 3D sensor layout, which in turn provides more informative input for pose reconstruction. We propose Ultra Diffusion Poser, a diffusion model that explicitly models these geometric constraints. It includes a Spatial Layout Module that analytically reconstructs the 3D sensor positions from UWB measurements. These sensor positions are used alongside IMU signals and UWB distances as a conditioning signal during diffusion. Still, network predictions can violate inter-sensor distance measurements. To address this, we introduce UWB-Diffusion Guidance, which encourages alignment between predicted poses and measured distances during diffusion sampling. Together, these contributions enable our model to achieve state-of-the-art performance, reducing joint position error by up to 22% over prior work.