AI-Generated Fall Data: Assessing LLMs and Diffusion Model for Wearable Fall Detection

📄 arXiv: 2505.04660v1 📥 PDF

作者: Sana Alamgeer, Yasine Souissi, Anne H. H. Ngu

分类: cs.CL, cs.CV

发布日期: 2025-05-07


💡 一句话要点

利用AI生成跌倒数据:评估LLM和扩散模型在可穿戴设备跌倒检测中的应用

🎯 匹配领域: 支柱四:生成式动作 (Generative Motion) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 跌倒检测 合成数据 大型语言模型 扩散模型 可穿戴设备 LSTM 数据增强

📋 核心要点

  1. 真实跌倒数据稀缺,特别是老年人数据,限制了跌倒检测系统的训练和泛化能力。
  2. 利用大型语言模型和扩散模型生成合成跌倒数据,以增强现有真实数据集,提升模型性能。
  3. 实验表明,LLM在低频数据上表现较好,扩散模型数据与真实数据对齐度高,但效果受传感器位置影响。

📝 摘要(中文)

由于真实世界跌倒数据,特别是老年人跌倒数据的稀缺性,训练跌倒检测系统极具挑战。为了解决这个问题,我们探索了大型语言模型(LLM)生成合成跌倒数据的潜力。本研究评估了文本到动作模型(T2M,SATO,ParCo)和文本到文本模型(GPT4o,GPT4,Gemini)在模拟真实跌倒场景中的表现。我们生成合成数据集,并将其与四个真实世界基线数据集集成,以评估它们对使用长短期记忆(LSTM)模型的跌倒检测性能的影响。此外,我们将LLM生成的合成数据与基于扩散的方法进行比较,以评估它们与真实加速度计分布的对齐情况。结果表明,数据集特征显著影响合成数据的有效性,LLM生成的数据在低频设置(例如,20Hz)中表现最佳,但在高频数据集(例如,200Hz)中表现出不稳定性。虽然文本到动作模型比文本到文本模型产生更真实的生物力学数据,但它们对跌倒检测的影响各不相同。基于扩散的合成数据表现出与真实数据最接近的对齐,但并未持续提高模型性能。消融研究进一步证实,合成数据的有效性取决于传感器放置和跌倒表示。这些发现为优化跌倒检测模型的合成数据生成提供了见解。

🔬 方法详解

问题定义:论文旨在解决真实世界跌倒数据不足的问题,特别是缺乏老年人的跌倒数据。现有方法依赖于有限的真实数据,导致模型泛化能力差,难以适应不同人群和场景。因此,如何生成高质量的合成跌倒数据,以增强现有数据集,提高跌倒检测模型的性能,是本文要解决的核心问题。

核心思路:论文的核心思路是利用大型语言模型(LLM)和扩散模型生成合成跌倒数据,并将其与真实数据结合,以提高跌倒检测模型的性能。通过文本描述生成动作数据,或直接生成加速度计数据,从而扩充数据集。这种方法旨在克服真实数据稀缺的限制,并提高模型的鲁棒性和泛化能力。

技术框架:整体框架包含以下几个主要阶段:1) 使用LLM(GPT4o, GPT4, Gemini)或文本到动作模型(SATO, ParCo)生成合成跌倒数据。2) 使用扩散模型生成合成加速度计数据。3) 将合成数据与真实跌倒数据集(未知具体数据集名称)进行混合。4) 使用LSTM模型在混合数据集上训练跌倒检测模型。5) 评估模型在真实数据集上的性能,并与仅使用真实数据训练的模型进行比较。6) 进行消融研究,分析不同传感器位置和跌倒表示对模型性能的影响。

关键创新:论文的关键创新在于探索了利用LLM和扩散模型生成合成跌倒数据的可行性,并评估了不同生成方法对跌倒检测模型性能的影响。与传统的数据增强方法相比,LLM和扩散模型能够生成更具多样性和真实性的数据,从而更好地模拟真实世界的跌倒场景。此外,论文还分析了合成数据在不同频率下的表现,以及传感器位置对模型性能的影响,为合成数据的优化提供了指导。

关键设计:论文的关键设计包括:1) 使用不同的LLM和文本到动作模型,比较它们生成数据的质量和对模型性能的影响。2) 使用扩散模型生成与真实加速度计数据分布对齐的合成数据。3) 使用LSTM模型作为跌倒检测器的基线模型。4) 通过消融研究,分析不同传感器位置(具体位置未知)和跌倒表示(具体表示方法未知)对模型性能的影响。5) 评估合成数据在不同频率(20Hz和200Hz)下的表现,以确定其适用范围。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,LLM生成的合成数据在低频(20Hz)数据集上表现最佳,但在高频(200Hz)数据集上不稳定。文本到动作模型生成的数据比文本到文本模型更真实,但对跌倒检测的影响不一。扩散模型生成的数据与真实数据对齐度最高,但未持续提升模型性能。消融研究表明,传感器位置和跌倒表示对合成数据的有效性有显著影响。

🎯 应用场景

该研究成果可应用于智能养老、健康监测等领域。通过生成合成跌倒数据,可以有效解决真实数据不足的问题,提高跌倒检测系统的准确性和可靠性,从而为老年人提供更安全的生活保障。未来,该技术还可扩展到其他人体动作识别领域,例如运动分析、康复训练等。

📄 摘要(原文)

Training fall detection systems is challenging due to the scarcity of real-world fall data, particularly from elderly individuals. To address this, we explore the potential of Large Language Models (LLMs) for generating synthetic fall data. This study evaluates text-to-motion (T2M, SATO, ParCo) and text-to-text models (GPT4o, GPT4, Gemini) in simulating realistic fall scenarios. We generate synthetic datasets and integrate them with four real-world baseline datasets to assess their impact on fall detection performance using a Long Short-Term Memory (LSTM) model. Additionally, we compare LLM-generated synthetic data with a diffusion-based method to evaluate their alignment with real accelerometer distributions. Results indicate that dataset characteristics significantly influence the effectiveness of synthetic data, with LLM-generated data performing best in low-frequency settings (e.g., 20Hz) while showing instability in high-frequency datasets (e.g., 200Hz). While text-to-motion models produce more realistic biomechanical data than text-to-text models, their impact on fall detection varies. Diffusion-based synthetic data demonstrates the closest alignment to real data but does not consistently enhance model performance. An ablation study further confirms that the effectiveness of synthetic data depends on sensor placement and fall representation. These findings provide insights into optimizing synthetic data generation for fall detection models.