PSG-MAE: Robust Multitask Sleep Event Monitoring using Multichannel PSG Reconstruction and Inter-channel Contrastive Learning

📄 arXiv: 2504.13229v1 📥 PDF

作者: Yifei Wang, Qi Liu, Fuli Min, Honghao Wang

分类: cs.LG

发布日期: 2025-04-17

备注: 11 pages, 5 figures


💡 一句话要点

提出PSG-MAE,通过多通道脑电重建和对比学习实现鲁棒的多任务睡眠事件监测。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 睡眠事件监测 多导睡眠图 自监督学习 掩码自编码器 对比学习 多通道信号处理 睡眠分期

📋 核心要点

  1. 现有睡眠事件监测模型依赖于单一任务和数据集,泛化能力差,难以适应新的睡眠事件和数据集。
  2. PSG-MAE利用掩码自编码器进行自监督预训练,学习鲁棒的特征提取器,并结合通道间对比学习增强多通道信息利用。
  3. 实验表明,PSG-MAE预训练的编码器在睡眠分期和阻塞性睡眠呼吸暂停检测中均取得了显著的准确率提升,验证了其鲁棒性和泛化能力。

📝 摘要(中文)

多导睡眠图(PSG)信号对于研究睡眠过程和诊断睡眠障碍至关重要。利用深度神经网络(DNNs)分析PSG数据以实现自动睡眠监测已变得越来越可行。然而,某些睡眠事件数据集的有限性通常导致DNNs专注于单一任务和单一来源的训练数据集。因此,这些模型难以迁移到新的睡眠事件,并且在应用于新数据集时缺乏鲁棒性。为了解决这些挑战,我们提出了一种基于掩码自编码器(MAE)的预训练框架PSG-MAE。通过在大量未标记的PSG数据上执行自监督学习,PSG-MAE开发了一个鲁棒的特征提取网络,可以广泛应用于各种睡眠事件监测任务。与传统的MAE不同,PSG-MAE生成跨PSG通道的互补掩码,集成了一种多通道信号重建方法,并采用了一种自监督的通道间对比学习(ICCL)策略。这种方法使编码器能够捕获来自每个通道的时间特征,同时学习通道之间的潜在关系,从而增强多通道信息的利用。实验结果表明,PSG-MAE有效地捕获了PSG信号的时间细节和通道间信息。当通过PSG-MAE预训练的编码器与下游特征分解网络进行微调时,它在睡眠分期中实现了83.7%的准确率,在阻塞性睡眠呼吸暂停检测中实现了90.45%的准确率,突出了该框架的鲁棒性和广泛适用性。

🔬 方法详解

问题定义:现有的睡眠事件监测模型通常针对特定任务和数据集进行训练,缺乏泛化能力和鲁棒性。当应用于新的睡眠事件或数据集时,性能会显著下降。这是因为模型过度拟合了特定数据集的特征,而未能学习到通用的睡眠生理信号表示。

核心思路:论文的核心思路是利用自监督学习,在大规模未标记的PSG数据上预训练一个鲁棒的特征提取器。通过掩码自编码器(MAE)结构,模型学习重建被掩盖的PSG信号,从而捕捉到睡眠生理信号的内在结构和时间依赖关系。此外,引入通道间对比学习(ICCL)来增强模型对多通道PSG信号之间关系的理解。

技术框架:PSG-MAE框架包含以下主要模块:1) 多通道PSG信号输入;2) 互补掩码生成,对不同通道施加不同的掩码;3) 基于MAE的编码器-解码器结构,编码器提取特征,解码器重建被掩盖的信号;4) 通道间对比学习模块,学习不同通道之间的潜在关系;5) 预训练好的编码器可以用于下游任务的微调,例如睡眠分期和阻塞性睡眠呼吸暂停检测。

关键创新:该论文的关键创新在于:1) 提出了基于MAE的自监督预训练框架,用于学习鲁棒的睡眠生理信号表示;2) 引入了互补掩码生成策略,增强了多通道信息的利用;3) 提出了通道间对比学习(ICCL)方法,显式地学习不同PSG通道之间的关系,从而提升了模型的性能。

关键设计:在掩码策略上,采用了互补掩码,即不同通道的掩码区域不同,以保证每个通道的信息都能被利用。在损失函数方面,使用了MAE的重建损失和ICCL的对比损失。网络结构方面,编码器和解码器可以采用Transformer或其他合适的网络结构。在下游任务微调时,可以添加特征分解网络来进一步提升性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,PSG-MAE在睡眠分期任务中达到了83.7%的准确率,在阻塞性睡眠呼吸暂停检测任务中达到了90.45%的准确率。相较于传统的监督学习方法,PSG-MAE在两个任务上均取得了显著的性能提升,验证了其鲁棒性和泛化能力。这些结果表明,通过自监督预训练,可以有效地学习到通用的睡眠生理信号表示,从而提升睡眠事件监测的性能。

🎯 应用场景

该研究成果可应用于自动睡眠监测系统,辅助医生进行睡眠障碍的诊断和治疗。通过预训练的鲁棒特征提取器,可以降低对标注数据的依赖,加速新睡眠事件的监测模型开发。此外,该方法还可以推广到其他多通道生理信号分析领域,例如心电信号分析和脑电信号分析。

📄 摘要(原文)

Polysomnography (PSG) signals are essential for studying sleep processes and diagnosing sleep disorders. Analyzing PSG data through deep neural networks (DNNs) for automated sleep monitoring has become increasingly feasible. However, the limited availability of datasets for certain sleep events often leads to DNNs focusing on a single task with a single-sourced training dataset. As a result, these models struggle to transfer to new sleep events and lack robustness when applied to new datasets. To address these challenges, we propose PSG-MAE, a mask autoencoder (MAE) based pre-training framework. By performing self-supervised learning on a large volume of unlabeled PSG data, PSG-MAE develops a robust feature extraction network that can be broadly applied to various sleep event monitoring tasks. Unlike conventional MAEs, PSG-MAE generates complementary masks across PSG channels, integrates a multichannel signal reconstruction method, and employs a self-supervised inter-channel contrastive learning (ICCL) strategy. This approach enables the encoder to capture temporal features from each channel while simultaneously learning latent relationships between channels, thereby enhancing the utilization of multichannel information. Experimental results show that PSG-MAE effectively captures both temporal details and inter-channel information from PSG signals. When the encoder pre-trained through PSG-MAE is fine-tuned with downstream feature decomposition networks, it achieves an accuracy of 83.7% for sleep staging and 90.45% for detecting obstructive sleep apnea, which highlights the framework's robustness and broad applicability.