SCG With Your Phone: Diagnosis of Rhythmic Spectrum Disorders in Field Conditions

📄 arXiv: 2601.13926v1 📥 PDF

作者: Peter Golenderov, Yaroslav Matushenko, Anastasia Tushina, Michal Barodkin

分类: q-bio.QM, cs.LG, eess.SP

发布日期: 2026-01-20


💡 一句话要点

提出一种基于智能手机SCG信号的深度学习框架,用于诊断节律谱紊乱

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 心震图 智能手机 深度学习 U-Net 心律分析 主动脉瓣开放 远程医疗

📋 核心要点

  1. 现有SCG信号分析方法在真实场景下,受噪声、运动伪影和设备差异影响,准确性面临挑战。
  2. 提出增强的U-Net v3架构,结合多尺度卷积、残差连接和注意力机制,提升噪声SCG信号的分割能力。
  3. 实验结果表明,该方法在不同设备和无监督数据采集条件下,均能实现高精度和鲁棒性的心律监测。

📝 摘要(中文)

本研究提出了一种鲁棒的深度学习框架,用于利用消费级智能手机采集的加速度计数据进行心震图(SCG)分割和节律分析。主动脉瓣开放(AO)事件对于检测频率和节律紊乱至关重要,尤其是在真实环境中,通过消费级智能手机收集的SCG信号容易受到噪声、运动伪影以及设备异质性引起的可变性的影响。该框架采用增强的U-Net v3架构,集成了多尺度卷积、残差连接和注意力门,从而能够可靠地分割噪声SCG信号。专门的后处理流程将概率掩码转换为精确的AO时间戳,而一种新颖的自适应3D到1D投影方法确保了对任意智能手机方向的鲁棒性。实验结果表明,该方法在各种设备类型和无监督数据采集条件下均实现了始终如一的高精度和鲁棒性。该方法实现了使用日常移动设备的实用、低成本和自动化的心律监测,为可扩展的、可现场部署的心血管评估和未来的多模态诊断系统铺平了道路。

🔬 方法详解

问题定义:论文旨在解决使用智能手机采集的心震图(SCG)信号进行准确心律分析的问题。现有方法在处理真实场景下采集的SCG信号时,容易受到噪声、运动伪影以及不同智能手机设备差异的影响,导致分割和分析精度下降。因此,需要一种鲁棒性强、能够适应各种设备和采集条件的SCG信号处理方法。

核心思路:论文的核心思路是利用深度学习技术,特别是改进的U-Net架构,从噪声和不确定性较高的智能手机SCG信号中准确分割出主动脉瓣开放(AO)事件。通过多尺度卷积提取不同尺度的特征,残差连接缓解梯度消失问题,注意力机制关注重要区域,从而提高分割精度。此外,采用自适应3D到1D投影方法,消除智能手机方向对信号的影响。

技术框架:整体框架包括三个主要阶段:1) SCG信号采集:使用智能手机的加速度计记录SCG信号。2) SCG信号分割:使用增强的U-Net v3网络对SCG信号进行分割,生成概率掩码。3) AO事件提取和节律分析:通过后处理流程将概率掩码转换为精确的AO时间戳,并进行心律分析。

关键创新:论文的关键创新点在于:1) 增强的U-Net v3架构,通过集成多尺度卷积、残差连接和注意力门,提高了对噪声SCG信号的分割精度。2) 自适应3D到1D投影方法,消除了智能手机方向对信号的影响,提高了方法的鲁棒性。3) 专门的后处理流程,将概率掩码转换为精确的AO时间戳,为后续的心律分析提供了准确的基础。

关键设计:增强的U-Net v3网络采用了多尺度卷积,使用不同大小的卷积核提取不同尺度的特征。残差连接通过跳跃连接缓解梯度消失问题,加速网络训练。注意力门机制使网络能够关注SCG信号中的重要区域,提高分割精度。自适应3D到1D投影方法通过坐标变换将三维加速度计数据投影到一维信号,消除了智能手机方向的影响。损失函数未知,但通常会采用Dice Loss或交叉熵损失函数。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文提出的方法在各种设备类型和无监督数据采集条件下均实现了高精度和鲁棒性。具体性能数据未知,但摘要强调了该方法在不同设备和条件下的稳定表现,表明其具有很强的实用价值。与传统方法相比,该方法能够更好地处理噪声和运动伪影,提高了心律分析的准确性。

🎯 应用场景

该研究成果可应用于远程医疗、家庭健康监测和大规模心血管疾病筛查。通过智能手机即可实现低成本、便捷的心律监测,有助于早期发现和管理心血管疾病风险,尤其是在医疗资源匮乏的地区具有重要意义。未来可集成到多模态诊断系统中,结合其他生理信号,提供更全面的心血管健康评估。

📄 摘要(原文)

Aortic valve opening (AO) events are crucial for detecting frequency and rhythm disorders, especially in real-world settings where seismocardiography (SCG) signals collected via consumer smartphones are subject to noise, motion artifacts, and variability caused by device heterogeneity. In this work, we present a robust deep-learning framework for SCG segmentation and rhythm analysis using accelerometer recordings obtained with consumer smartphones. We develop an enhanced U-Net v3 architecture that integrates multi-scale convolutions, residual connections, and attention gates, enabling reliable segmentation of noisy SCG signals. A dedicated post-processing pipeline converts probability masks into precise AO timestamps, whereas a novel adaptive 3D-to-1D projection method ensures robustness to arbitrary smartphone orientation. Experimental results demonstrate that the proposed method achieves consistently high accuracy and robustness across various device types and unsupervised data-collection conditions. Our approach enables practical, low-cost, and automated cardiac-rhythm monitoring using everyday mobile devices, paving the way for scalable, field-deployable cardiovascular assessment and future multimodal diagnostic systems.