Time-Series at the Edge: Tiny Separable CNNs for Wearable Gait Detection and Optimal Sensor Placement

📄 arXiv: 2512.00396v2 📥 PDF

作者: Andrea Procopio, Marco Esposito, Sara Raggiunto, Andrey Gizdov, Alberto Belli, Paola Pierleoni

分类: cs.LG, cs.AI, cs.CV, eess.IV

发布日期: 2025-11-29 (更新: 2025-12-11)


💡 一句话要点

针对可穿戴设备,提出超轻量级可分离卷积神经网络用于帕金森病步态检测和优化传感器位置。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 步态检测 帕金森病 可穿戴设备 深度可分离卷积 边缘计算

📋 核心要点

  1. 现有步态检测方法在资源受限的可穿戴设备上部署困难,精度和效率难以兼顾。
  2. 提出超轻量级可分离卷积神经网络,通过深度可分离卷积和残差连接,降低模型复杂度。
  3. 实验表明,该模型在精度与基线相当的情况下,参数量减少约10倍,且满足边缘设备实时性要求。

📝 摘要(中文)

本文研究了在资源受限的可穿戴设备和边缘节点上,使用三轴加速度的短时窗进行帕金森病(PD)步态检测的设备端时间序列分析。我们将幅度阈值法与三种用于时间序列分析的1D CNN进行比较:一种文献基线(可分离卷积)和两种超轻量级模型——一种纯可分离模型和一种具有残差连接的模型。使用BioStampRC21数据集,2秒窗口,30 Hz采样率,以及在16名佩戴胸部IMU的PwPD上进行的主体独立留一法(LOSO)验证,我们的残差可分离模型(模型2,533个参数)达到了PR-AUC = 94.5%,F1 = 91.2%,MCC = 89.4%,与基线模型(5,552个参数;PR-AUC = 93.7%,F1 = 90.5%,MCC = 88.5%)相当或超过,但参数数量减少了约10倍。最小的模型(模型1,305个参数)达到了PR-AUC = 94.0%,F1 = 91.0%,MCC = 89.1%。传感器位置分析表明,胸部和大腿是最可靠的;前臂由于非步态手臂运动而降低了精度/召回率;所有位置的简单融合并没有优于最佳单个位置。两种紧凑型CNN在STM32级MCU上都能在严格的内存/延迟预算内执行(在低功耗板上低于10毫秒),从而能够对传输/存储进行传感器端门控。总体而言,超轻量级可分离CNN为可穿戴PD步态检测提供了优于固定阈值的精度-效率-泛化折衷方案,并强调了为边缘部署量身定制的时间序列模型的价值。

🔬 方法详解

问题定义:论文旨在解决帕金森病患者步态检测问题,特别是在资源受限的可穿戴设备上。现有方法,如简单的阈值法,精度较低,易受个体差异影响。而复杂的深度学习模型计算量大,难以在低功耗的边缘设备上部署。

核心思路:论文的核心思路是设计超轻量级的卷积神经网络,利用深度可分离卷积降低模型参数量,同时通过残差连接提升模型性能。这种设计旨在在精度、效率和泛化能力之间取得平衡,从而实现在边缘设备上的高效步态检测。

技术框架:整体框架包括数据采集、预处理、模型训练和部署。首先,从可穿戴设备(IMU)采集三轴加速度数据。然后,将数据分割成短时窗(2秒),并进行预处理。接着,使用提出的超轻量级CNN模型进行训练,模型包括纯可分离卷积模型和带残差连接的可分离卷积模型。最后,将训练好的模型部署到边缘设备上,实现实时的步态检测。

关键创新:最重要的技术创新点在于提出了两种超轻量级的可分离卷积神经网络结构,特别是在可穿戴设备上应用。与传统CNN相比,深度可分离卷积显著减少了参数量和计算复杂度,使得模型能够在资源受限的边缘设备上运行。残差连接的引入进一步提升了模型的性能。

关键设计:论文设计了两种模型:Model 1是纯可分离卷积模型,参数量为305;Model 2在Model 1的基础上增加了残差连接,参数量为533。输入数据为2秒窗口,30Hz采样率的三轴加速度数据。损失函数未知,但通常分类任务会使用交叉熵损失函数。网络结构细节未知,但可以推测包含多个可分离卷积层、池化层和全连接层。

📊 实验亮点

实验结果表明,提出的残差可分离模型(Model 2,533个参数)在BioStampRC21数据集上达到了PR-AUC = 94.5%,F1 = 91.2%,MCC = 89.4%,与参数量为5,552的基线模型相比,性能相当甚至略有提升,但参数量减少了约10倍。此外,该模型在STM32级MCU上的执行时间低于10毫秒,满足实时性要求。

🎯 应用场景

该研究成果可应用于帕金森病患者的远程健康监测、步态分析和康复训练。通过在可穿戴设备上实时检测步态,可以为医生提供更准确的患者运动数据,辅助诊断和治疗。此外,该技术还可扩展到其他运动障碍疾病的监测,具有广泛的应用前景。

📄 摘要(原文)

We study on-device time-series analysis for gait detection in Parkinson's disease (PD) from short windows of triaxial acceleration, targeting resource-constrained wearables and edge nodes. We compare magnitude thresholding to three 1D CNNs for time-series analysis: a literature baseline (separable convolutions) and two ultra-light models - one purely separable and one with residual connections. Using the BioStampRC21 dataset, 2 s windows at 30 Hz, and subject-independent leave-one-subject-out (LOSO) validation on 16 PwPD with chest-worn IMUs, our residual separable model (Model 2, 533 params) attains PR-AUC = 94.5%, F1 = 91.2%, MCC = 89.4%, matching or surpassing the baseline (5,552 params; PR-AUC = 93.7%, F1 = 90.5%, MCC = 88.5%) with approximately 10x fewer parameters. The smallest model (Model 1, 305 params) reaches PR-AUC = 94.0%, F1 = 91.0%, MCC = 89.1%. Thresholding obtains high recall (89.0%) but low precision (76.5%), yielding many false positives and high inter-subject variance. Sensor-position analysis (train-on-all) shows chest and thighs are most reliable; forearms degrade precision/recall due to non-gait arm motion; naive fusion of all sites does not outperform the best single site. Both compact CNNs execute within tight memory/latency budgets on STM32-class MCUs (sub-10 ms on low-power boards), enabling on-sensor gating of transmission/storage. Overall, ultra-light separable CNNs provide a superior accuracy-efficiency-generalization trade-off to fixed thresholds for wearable PD gait detection and underscore the value of tailored time-series models for edge deployment.