Task-guided Spatiotemporal Network with Diffusion Augmentation for EEG-based Dementia Diagnosis and MMSE Prediction
作者: Xiaoyu Zheng, Xu Tian, Bin Jiao, Kunbo Cui, Hanhe Lin, Lu Shen, Jin Liu
分类: cs.LG, cs.AI
发布日期: 2026-04-27
💡 一句话要点
提出任务引导的时空网络,结合扩散增强,用于脑电图的老年痴呆症诊断和MMSE预测。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 脑电图分析 痴呆症诊断 多任务学习 时空网络 扩散模型 数据增强 认知功能评估
📋 核心要点
- 传统多任务学习在脑电图分析中存在特征纠缠,导致痴呆症诊断和MMSE预测任务间相互干扰。
- 提出任务引导的时空网络(TGSN),通过多频带特征融合、扩散增强和任务引导查询模块,实现更有效的特征提取。
- 在XY02数据集上,TGSN在痴呆症分类和MMSE预测方面均显著优于现有方法,并在DS004504数据集上展现出良好的泛化能力。
📝 摘要(中文)
痴呆症患者通常表现出认知障碍,通常使用简易精神状态检查(MMSE)进行评估。同时,他们的潜在神经生理异常反映在脑电图(EEG)中,为联合建模提供了基础。然而,传统的多任务方法存在特征纠缠问题,导致处理异构目标时出现任务间干扰。为了解决这一挑战,我们提出了一种任务引导的时空网络(TGSN),结合扩散增强,用于基于脑电图的痴呆症诊断和MMSE预测。具体来说,TGSN集成了多频带特征融合模块,以捕获脑电图的互补频谱信息。同时,引入了利用扩散过程的预训练数据增强模块,以增加样本多样性。为了建模脑电图的复杂时空模式,我们提出了一种门控时空注意力模块,该模块捕获长程空间依赖性和时间动态。此外,我们设计了一个任务引导的查询模块,以实现特定于任务的特征提取,从而减轻任务干扰。TGSN的有效性在XY02数据集上进行了评估。实验结果表明,所提出的网络优于几种最先进的方法,阿尔茨海默病(AD)/额颞叶痴呆(FTD)的分类准确率达到97.78%,AD/FTD/血管性认知障碍(VCI)的分类准确率达到83.93%,分别超过最佳基线16.39%和8.28%。同时,它将MMSE预测的RMSE降低到1.93和2.38,与最佳基线相比,分别实现了1.44和1.43的显着误差降低。此外,在DS004504数据集上的验证表明了强大的跨数据集泛化能力。
🔬 方法详解
问题定义:论文旨在解决基于脑电图(EEG)的痴呆症诊断和简易精神状态检查(MMSE)预测问题。传统的多任务学习方法在处理这两个异构任务时,容易出现特征纠缠,导致任务间的相互干扰,影响诊断和预测的准确性。现有方法难以有效提取脑电图中的复杂时空特征,并且缺乏足够的样本多样性。
核心思路:论文的核心思路是通过设计一个任务引导的时空网络(TGSN),结合扩散增强,来缓解任务间的干扰,并有效提取脑电图中的时空特征。TGSN通过多频带特征融合模块捕获互补的频谱信息,利用扩散过程进行数据增强以增加样本多样性,并使用门控时空注意力模块建模长程时空依赖关系。任务引导查询模块则用于实现特定于任务的特征提取。
技术框架:TGSN的整体架构包括以下几个主要模块:1) 多频带特征融合模块:用于提取脑电图信号在不同频带上的特征。2) 扩散增强模块:利用预训练的扩散模型生成新的脑电图样本,增加数据多样性。3) 门控时空注意力模块:用于捕获脑电图信号中的长程空间依赖性和时间动态。4) 任务引导查询模块:根据不同的任务(痴呆症诊断或MMSE预测),提取相应的特征。最后,将提取的特征用于分类或回归任务。
关键创新:论文的主要创新点在于提出了任务引导查询模块,该模块能够根据不同的任务需求,自适应地提取相关的特征,从而减轻任务间的干扰。此外,结合扩散增强模块,增加了训练样本的多样性,提高了模型的泛化能力。门控时空注意力模块的设计也能够更有效地建模脑电图信号中的复杂时空模式。
关键设计:扩散增强模块使用预训练的扩散模型,具体参数未知。门控时空注意力模块的具体门控机制和注意力计算方式未知。任务引导查询模块的设计细节,例如查询向量的生成方式和特征选择策略,也未知。损失函数的设计可能包括分类损失(例如交叉熵损失)和回归损失(例如均方误差损失),以及可能的正则化项。
🖼️ 关键图片
📊 实验亮点
实验结果表明,TGSN在XY02数据集上取得了显著的性能提升。在AD/FTD分类任务中,准确率达到97.78%,超过最佳基线16.39%。在AD/FTD/VCI分类任务中,准确率达到83.93%,超过最佳基线8.28%。在MMSE预测任务中,RMSE降低到1.93和2.38,与最佳基线相比,分别降低了1.44和1.43。此外,在DS004504数据集上的验证表明了TGSN具有良好的跨数据集泛化能力。
🎯 应用场景
该研究成果可应用于临床痴呆症的早期诊断和认知功能评估。通过分析脑电图信号,可以辅助医生进行更准确、客观的诊断,并预测患者的认知功能水平。该技术有望降低诊断成本,提高诊断效率,并为个性化治疗方案的制定提供依据。未来,该方法可以推广到其他神经系统疾病的诊断和监测中。
📄 摘要(原文)
Patients with dementia typically exhibit cognitive impairment, which is routinely assessed using the Mini-Mental State Examination (MMSE). Concurrently, their underlying neurophysiological abnormalities are reflected in Electroencephalography (EEG), providing a basis for joint modeling. However, traditional multi-task approaches suffer from feature entanglement, which leads to inter-task interference when handling heterogeneous objectives.To address this challenge, we propose a task-guided spatiotemporal network (TGSN) with diffusion augmentation for EEG-based dementia diagnosis and MMSE prediction. Specifically, TGSN integrates a multi-band feature fusion module to capture complementary spectral information from EEG. Meanwhile, a pre-trained data augmentation module utilizing a diffusion process is introduced toincrease sample diversity. To model the complex spatiotemporal patterns of EEG, we propose a gated spatiotemporal attention module that captures long-range spatial dependencies and temporal dynamics. Moreover, we design a task-guided query module to achieve task-specific feature extraction, thereby mitigating task interference. The effectiveness of TGSN is evaluated on the XY02 dataset. Experimental results demonstrate that the proposed network outperforms several state-of-the-art methods, achieving classification accuracies of 97.78\% for Alzheimer's Disease (AD)/Frontotemporal Dementia (FTD) and 83.93\% for AD/FTD/Vascular Cognitive Impairment (VCI), which exceed the best baselines by 16.39\% and 8.28\%, respectively. In parallel, it reduces the RMSE for MMSE prediction to 1.93 and 2.38, achieving significant error reductions of 1.44 and 1.43 compared to the best baselines. Additionally, validation on the DS004504 dataset demonstrates strong cross-dataset generalization...