MoCap-Impute: A Comprehensive Benchmark and Comparative Analysis of Imputation Methods for IMU-based Motion Capture Data

📄 arXiv: 2507.10334v1 📥 PDF

作者: Mahmoud Bekhit, Ahmad Salah, Ahmed Salim Alrawahi, Tarek Attia, Ahmed Ali, Esraa Eldesokey, Ahmed Fathalla

分类: cs.LG

发布日期: 2025-07-14

备注: 22 pages, 7 figures, 3 algorithms, 2 tables


💡 一句话要点

MoCap-Impute:针对IMU运动捕捉数据缺失值插补的综合基准与对比分析

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱六:视频提取与匹配 (Video Extraction)

关键词: 运动捕捉 IMU 缺失值插补 时间序列 深度学习

📋 核心要点

  1. 现有的IMU运动捕捉数据插补方法缺乏系统性的性能评估,难以指导实际应用。
  2. 论文构建了首个公开的IMU运动捕捉插补数据集,并全面对比了统计、机器学习和深度学习方法。
  3. 实验表明,多变量插补方法在处理复杂缺失模式时显著优于单变量方法,GAIN等模型表现最佳。

📝 摘要(中文)

基于可穿戴惯性测量单元(IMU)的运动捕捉(MoCap)数据对于运动科学等应用至关重要,但其效用经常因数据缺失而受损。尽管存在大量的插补技术,但针对IMU导出的MoCap时间序列数据的系统性能评估仍然缺乏。我们通过对统计、机器学习和深度学习插补方法进行全面的比较分析来解决这一差距。我们的评估考虑了三种不同的情境:单变量时间序列、跨被试的多变量和跨运动学角度的多变量。为了促进这一基准测试,我们推出了第一个专门为插补设计的公开MoCap数据集,其中包含来自53名空手道练习者的数据。我们模拟了三种受控的缺失机制:完全随机缺失(MCAR)、块缺失以及信号转换点处的新型值依赖模式。我们在所有受试者的39个运动学变量上进行的实验表明,多变量插补框架始终优于单变量方法,尤其是在复杂的缺失情况下。例如,对于转换点缺失,多变量方法相比于单变量技术,平均绝对误差最多可降低50%(MAE从10.8降至5.8)。生成对抗插补网络(GAIN)和迭代插补器等高级模型在这些具有挑战性的场景中表现出最高的准确性。这项工作为未来的研究提供了关键的基线,并为提高MoCap数据分析的完整性和鲁棒性提供了实用的建议。

🔬 方法详解

问题定义:论文旨在解决基于IMU的运动捕捉数据中普遍存在的缺失值问题。现有方法缺乏针对IMU数据的系统性评估,难以选择合适的插补策略。此外,现有方法在处理复杂缺失模式(如信号转换点处的缺失)时表现不佳,影响了运动分析的准确性。

核心思路:论文的核心思路是通过构建一个专门用于插补的IMU运动捕捉数据集,并在此数据集上对各种插补方法进行全面的对比分析,从而为研究人员和从业者提供选择合适插补策略的指导。论文强调了多变量插补方法在处理复杂缺失模式时的优势。

技术框架:论文的技术框架主要包括以下几个部分:1) 构建IMU运动捕捉数据集,包含53名空手道练习者的运动数据;2) 模拟三种不同的缺失机制:完全随机缺失(MCAR)、块缺失和信号转换点缺失;3) 选择多种插补方法,包括统计方法、机器学习方法和深度学习方法;4) 在数据集上对各种插补方法进行评估,并比较它们的性能。

关键创新:论文的关键创新在于:1) 构建了首个公开的IMU运动捕捉插补数据集,为相关研究提供了基准;2) 提出了信号转换点缺失这种新的缺失模式,更贴近实际应用场景;3) 对比分析了多种插补方法在不同缺失模式下的性能,为选择合适的插补策略提供了指导。

关键设计:论文的关键设计包括:1) 数据集包含39个运动学变量,覆盖了全身的运动信息;2) 模拟了三种不同的缺失机制,包括MCAR、块缺失和信号转换点缺失;3) 选择了多种插补方法,包括均值插补、线性插值、K近邻插补、矩阵分解、生成对抗插补网络(GAIN)和迭代插补器等。实验中使用了平均绝对误差(MAE)作为评估指标。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,多变量插补方法在处理复杂缺失模式时显著优于单变量方法。例如,对于转换点缺失,多变量方法相比于单变量技术,平均绝对误差最多可降低50%(MAE从10.8降至5.8)。生成对抗插补网络(GAIN)和迭代插补器等高级模型在这些具有挑战性的场景中表现出最高的准确性。

🎯 应用场景

该研究成果可广泛应用于运动科学、康复医学、人机交互等领域。通过提高运动捕捉数据的完整性和准确性,可以更有效地进行运动分析、姿态识别和动作控制。该研究为开发更智能、更可靠的运动捕捉系统奠定了基础,具有重要的实际应用价值和未来发展潜力。

📄 摘要(原文)

Motion capture (MoCap) data from wearable Inertial Measurement Units (IMUs) is vital for applications in sports science, but its utility is often compromised by missing data. Despite numerous imputation techniques, a systematic performance evaluation for IMU-derived MoCap time-series data is lacking. We address this gap by conducting a comprehensive comparative analysis of statistical, machine learning, and deep learning imputation methods. Our evaluation considers three distinct contexts: univariate time-series, multivariate across subjects, and multivariate across kinematic angles. To facilitate this benchmark, we introduce the first publicly available MoCap dataset designed specifically for imputation, featuring data from 53 karate practitioners. We simulate three controlled missingness mechanisms: missing completely at random (MCAR), block missingness, and a novel value-dependent pattern at signal transition points. Our experiments, conducted on 39 kinematic variables across all subjects, reveal that multivariate imputation frameworks consistently outperform univariate approaches, particularly for complex missingness. For instance, multivariate methods achieve up to a 50% mean absolute error reduction (MAE from 10.8 to 5.8) compared to univariate techniques for transition point missingness. Advanced models like Generative Adversarial Imputation Networks (GAIN) and Iterative Imputers demonstrate the highest accuracy in these challenging scenarios. This work provides a critical baseline for future research and offers practical recommendations for improving the integrity and robustness of Mo-Cap data analysis.