WildPPG: A Real-World PPG Dataset of Long Continuous Recordings

📄 arXiv: 2412.17540v1 📥 PDF

作者: Manuel Meier, Berken Utku Demirel, Christian Holz

分类: cs.CV

发布日期: 2024-12-23

备注: Accepted at NeurIPS2024


💡 一句话要点

WildPPG:发布长时连续PPG数据集,并提出更鲁棒的真实场景心率估计方法

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: PPG 心率估计 可穿戴设备 真实世界数据 多模态数据融合

📋 核心要点

  1. 现有心率(HR)估计算法在处理真实户外场景数据时表现不佳,因为它们依赖于受控条件下的数据集。
  2. 论文提出一种新的HR估计方法,旨在提高在真实世界场景下的鲁棒性,并构建了一个新的多模态数据集WildPPG。
  3. 实验结果表明,提出的方法在真实场景下比现有基线方法更稳健,为心率监测提供了更可靠的解决方案。

📝 摘要(中文)

反射式光电容积脉搏波描记法(PPG)已成为可穿戴设备中监测心脏活动(通过心率HR)的默认传感技术。然而,基于PPG的HR估计会受到多种因素的显著影响,例如穿戴者的活动、传感器位置和由此产生的运动伪影,以及环境特征(如温度和环境光)。这些因素会显著影响并降低HR预测的可靠性。本文表明,最先进的HR估计方法在处理来自户外环境中日常活动的代表性数据时表现不佳,这可能是因为它们依赖于捕获受控条件的现有数据集。我们引入了一个新的多模态数据集,并对16名参与者在13.5小时的户外活动中连续PPG记录的基准结果进行了评估,这些数据来自四个可穿戴传感器,每个传感器佩戴在身体的不同位置,总计216小时。我们的记录包括加速度计、温度和海拔数据,以及同步的基于Lead I的心电图,用于提供真实HR参考。参与者在一天内完成了从苏黎世到少女峰(瑞士的一座高山)的往返行程。行程包括户外和室内活动,如步行、徒步旅行、爬楼梯、饮食和休息,以及在各种温度和海拔高度(高达海拔3,571米)下使用汽车、火车、缆车和电梯进行运输——所有这些都影响了参与者的生理动态。我们还提出了一种新方法,与现有基线相比,该方法在这些真实场景中更稳健地估计HR值。

🔬 方法详解

问题定义:现有基于PPG的心率估计算法在受控环境下表现良好,但在真实世界的复杂场景中,由于运动伪影、环境因素(温度、光照)以及个体活动的影响,其准确性和可靠性显著下降。现有数据集无法充分代表这些真实场景的复杂性,导致算法在实际应用中表现不佳。

核心思路:论文的核心思路是构建一个包含丰富真实世界场景数据的多模态数据集,并基于此数据集开发一种更鲁棒的心率估计算法。通过采集长时间、多场景、多模态的数据,算法能够学习到更强的抗干扰能力,从而在真实场景中更准确地估计心率。

技术框架:该研究的技术框架主要包含两个部分:一是WildPPG数据集的构建,二是心率估计算法的开发。WildPPG数据集包含来自16名参与者在各种户外和室内活动中的PPG信号、加速度计数据、温度数据、海拔数据以及同步的Lead I心电图。心率估计算法(具体算法细节未知)利用这些多模态数据,旨在提高在复杂场景下的心率估计准确性。

关键创新:该研究的关键创新在于:1)构建了一个大规模、多模态的真实世界PPG数据集WildPPG,该数据集包含了各种复杂的活动和环境条件,更真实地反映了实际应用场景;2)提出了一种新的心率估计算法(具体算法未知),该算法在WildPPG数据集上表现出比现有基线方法更强的鲁棒性。

关键设计:论文中没有详细描述心率估计算法的具体设计细节,例如具体的参数设置、损失函数或网络结构。但是,可以推断该算法可能利用了多模态数据融合技术,例如使用加速度计数据来消除运动伪影,或者使用温度和海拔数据来校正PPG信号。此外,该算法可能采用了更复杂的信号处理技术或机器学习模型,以提高在复杂场景下的心率估计准确性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文构建了包含216小时数据的WildPPG数据集,并提出了一种新的心率估计算法。实验结果表明,该算法在WildPPG数据集上比现有基线方法表现出更强的鲁棒性,尤其是在户外活动和复杂环境条件下。具体的性能提升数据未知,但论文强调了该算法在真实场景下的优越性。

🎯 应用场景

该研究成果可广泛应用于可穿戴设备、远程医疗、运动健康监测等领域。通过提高真实场景下的心率监测准确性,可以为用户提供更可靠的健康数据,帮助用户更好地了解自身生理状态,并为医疗诊断提供更准确的依据。未来,该技术有望应用于更广泛的健康管理场景,例如老年人健康监护、慢性病管理等。

📄 摘要(原文)

Reflective photoplethysmography (PPG) has become the default sensing technique in wearable devices to monitor cardiac activity via a person's heart rate (HR). However, PPG-based HR estimates can be substantially impacted by factors such as the wearer's activities, sensor placement and resulting motion artifacts, as well as environmental characteristics such as temperature and ambient light. These and other factors can significantly impact and decrease HR prediction reliability. In this paper, we show that state-of-the-art HR estimation methods struggle when processing \emph{representative} data from everyday activities in outdoor environments, likely because they rely on existing datasets that captured controlled conditions. We introduce a novel multimodal dataset and benchmark results for continuous PPG recordings during outdoor activities from 16 participants over 13.5 hours, captured from four wearable sensors, each worn at a different location on the body, totaling 216\,hours. Our recordings include accelerometer, temperature, and altitude data, as well as a synchronized Lead I-based electrocardiogram for ground-truth HR references. Participants completed a round trip from Zurich to Jungfraujoch, a tall mountain in Switzerland over the course of one day. The trip included outdoor and indoor activities such as walking, hiking, stair climbing, eating, drinking, and resting at various temperatures and altitudes (up to 3,571\,m above sea level) as well as using cars, trains, cable cars, and lifts for transport -- all of which impacted participants' physiological dynamics. We also present a novel method that estimates HR values more robustly in such real-world scenarios than existing baselines.