Uncertainty Reliability Under Domain Shift: An Investigation for Data-Driven Blood Pressure Estimation in Photoplethysmography
作者: Mohammad Moulaeifard, Ciaran Bench, Philip J. Aston, Nils Strodthoff
分类: cs.LG, stat.ML
发布日期: 2026-05-18
备注: 23 pages, 2 figures
💡 一句话要点
针对PPG血压估计,研究领域偏移下的不确定性量化可靠性问题,提出DE+GNLL+CP/TS方案。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 血压估计 光电容积脉搏波 领域偏移 不确定性量化 深度集成 共形预测 温度缩放
📋 核心要点
- 现有基于PPG的血压估计方法在领域偏移下,不确定性量化(UQ)的可靠性评估不足,限制了其在实际医疗场景中的应用。
- 论文提出结合深度集成(DE)与高斯负对数似然(GNLL)损失,并采用共形预测(CP)或温度缩放(TS)进行事后校准,提升模型在领域偏移下的不确定性可靠性。
- 实验结果表明,DE在领域偏移下具有更强的预测鲁棒性,GNLL提供更强的原生UQ能力,而CP和TS能够有效提升MSE损失下的不确定性校准效果。
📝 摘要(中文)
不确定性量化(UQ)对于医疗保健等安全关键领域至关重要,但在实际的分布外(OOD)条件下很少对其进行评估。本文评估了基于深度学习的光电容积脉搏波(PPG)信号血压(BP)估计在分布内(ID)和OOD设置下的预测性能和不确定性可靠性。使用在PulseDB上训练的XResNet1D-50,并在四个外部数据集上进行测试,我们比较了深度集成(DE)和蒙特卡洛dropout(MCD)与高斯负对数似然(GNLL)和均方误差(MSE)损失,并可选地通过共形预测(CP)、温度缩放(TS)和等渗回归(IR)进行事后重新校准。研究的关键发现如下:(1)DE在领域偏移下比MCD提供更强的预测鲁棒性,这种优势主要在外部偏移下变得明显。(2)重新校准的基于GNLL的方法产生最佳的不确定性校准(例如,收缩压(SBP)的GNLL+DE+CP,舒张压(DBP)的GNLL+DE+TS),而基于MSE的不确定性需要重新校准才能变得实用。(3)在各种设置中,CP和TS提供了最一致的增益,而IR在几种情况下仍然具有竞争力。总的来说,我们的结果表明,基于DE的方法在领域偏移下的预测性能最稳健,GNLL在原生UQ方面最强,而重新校准对于使基于MSE的不确定性实用至关重要。这些发现强调了需要共同评估外部数据的预测准确性和校准,以实现可信的无袖带血压估计。
🔬 方法详解
问题定义:论文旨在解决基于PPG信号的血压估计模型在实际应用中,由于数据分布差异(领域偏移)导致的不确定性量化不可靠的问题。现有方法在训练数据和测试数据分布一致时表现良好,但在实际应用中,由于个体差异、设备差异等因素,测试数据往往与训练数据存在显著差异,导致模型预测结果的不确定性评估不准确,影响了临床决策的可靠性。
核心思路:论文的核心思路是利用深度集成(DE)提高模型的预测鲁棒性,并结合高斯负对数似然(GNLL)损失函数进行训练,以获得更准确的不确定性估计。此外,采用共形预测(CP)、温度缩放(TS)和等渗回归(IR)等方法对模型输出的不确定性进行事后校准,使其与实际误差分布更加一致。这样设计的目的是提高模型在领域偏移下的预测准确性和不确定性评估的可靠性。
技术框架:整体框架包括以下几个主要步骤:1) 使用PulseDB数据集训练XResNet1D-50模型,分别采用深度集成(DE)和蒙特卡洛dropout(MCD)作为不确定性量化方法,并使用高斯负对数似然(GNLL)和均方误差(MSE)作为损失函数。2) 在四个外部数据集上评估模型的预测性能和不确定性可靠性。3) 使用共形预测(CP)、温度缩放(TS)和等渗回归(IR)对模型输出的不确定性进行事后校准。4) 对比不同方法在领域偏移下的性能表现,分析其优缺点。
关键创新:论文的关键创新在于:1) 系统性地研究了领域偏移对基于PPG信号的血压估计模型不确定性量化的影响。2) 提出了结合深度集成(DE)、高斯负对数似然(GNLL)和事后校准方法(CP/TS)的解决方案,有效提高了模型在领域偏移下的预测鲁棒性和不确定性可靠性。3) 实验结果表明,该方法优于传统的蒙特卡洛dropout(MCD)方法。
关键设计:论文的关键设计包括:1) 使用XResNet1D-50作为基础模型,适用于处理一维PPG信号。2) 采用深度集成(DE)方法,通过训练多个模型并对其预测结果进行平均,提高模型的鲁棒性。3) 使用高斯负对数似然(GNLL)损失函数,直接优化模型输出的不确定性。4) 采用共形预测(CP)和温度缩放(TS)等事后校准方法,调整模型输出的不确定性,使其与实际误差分布更加一致。
🖼️ 关键图片
📊 实验亮点
实验结果表明,深度集成(DE)在领域偏移下比蒙特卡洛dropout(MCD)具有更强的预测鲁棒性。基于GNLL的方法在不确定性校准方面表现最佳,特别是GNLL+DE+CP方案在收缩压(SBP)估计中,GNLL+DE+TS方案在舒张压(DBP)估计中。此外,共形预测(CP)和温度缩放(TS)提供了最一致的增益,而等渗回归(IR)在几种情况下仍然具有竞争力。
🎯 应用场景
该研究成果可应用于可穿戴设备和移动医疗领域,实现更准确、可靠的无袖带血压监测。通过提高模型在不同人群和设备上的泛化能力,可以为远程医疗、慢性病管理等提供更有效的支持,降低医疗成本,改善患者的生活质量。未来,该方法有望推广到其他生理信号的分析和预测中。
📄 摘要(原文)
Uncertainty quantification (UQ) is critical for safety-critical domains like healthcare, yet it is rarely evaluated under realistic out-of-distribution (OOD) conditions. Here, we assessed predictive performance and uncertainty reliability for deep learning-based blood pressure (BP) estimation from photoplethysmography (PPG) signals under both in-distribution (ID) and OOD settings. Using an XResNet1D-50 trained on PulseDB and tested on four external datasets, we compared deep ensembles (DE) and Monte Carlo dropout (MCD) with Gaussian negative log-likelihood (GNLL) and mean squared error (MSE) losses, optionally followed by post-hoc recalibration via conformal prediction (CP), temperature scaling (TS), and isotonic regression (IR). The key findings of our study are as follows: (1) DE provides stronger predictive robustness under domain shift than MCD, an advantage that becomes clear primarily under external shift. (2) Recalibrated GNLL-based methods yield the best uncertainty calibration (e.g., GNLL+DE+CP for systolic blood pressure (SBP), GNLL+DE+TS for diastolic blood pressure (DBP)), while MSE-based uncertainty requires recalibration to become practically useful. (3) Across settings, CP and TS offer the most consistent gains, with IR remaining competitive in several cases. Overall, our results identify DE-based methods as most robust for predictive performance under domain shift, GNLL as strongest for native UQ, and recalibration as essential for making MSE-based uncertainty practical. These findings highlight the need to jointly assess predictive accuracy and calibration on external data for trustworthy cuffless BP estimation