SSL-AD: Spatiotemporal Self-Supervised Learning for Generalizability and Adaptability Across Alzheimer's Prediction Tasks and Datasets
作者: Emily Kaczmarek, Justin Szeto, Brennan Nichyporuk, Tal Arbel
分类: cs.CV, cs.LG
发布日期: 2025-09-12
🔗 代码/项目: GITHUB
💡 一句话要点
SSL-AD:时空自监督学习提升阿尔茨海默病预测任务的泛化性和适应性
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)
关键词: 阿尔茨海默病 自监督学习 时空学习 脑部MRI 深度学习
📋 核心要点
- 现有阿尔茨海默病预测模型面临标记数据不足、泛化性差、对输入数据长度和时间间隔敏感等挑战。
- 论文提出一种基于时空自监督学习(SSL-AD)的方法,通过预训练学习鲁棒的空间特征和处理变长输入。
- 实验结果表明,该方法在多个阿尔茨海默病预测任务上优于监督学习,并展现出良好的适应性和泛化能力。
📝 摘要(中文)
阿尔茨海默病是一种进行性的神经退行性疾病,会导致记忆丧失和认知能力下降。尽管深度学习模型在阿尔茨海默病预测任务中得到了广泛应用,但这些模型仍然受到可用标记数据不足、跨数据集泛化能力差以及对不同数量的输入扫描和扫描之间的时间间隔不灵活等因素的限制。本研究针对3D脑部MRI分析,调整了三种最先进的时序自监督学习(SSL)方法,并添加了新的扩展,旨在处理可变长度的输入并学习鲁棒的空间特征。我们汇总了四个公开可用的数据集,包含3161名患者用于预训练,并展示了我们的模型在多个阿尔茨海默病预测任务中的性能,包括诊断分类、转换检测和未来转换预测。重要的是,我们使用时间顺序预测和对比学习实现的SSL模型在七个下游任务中的六个上优于监督学习,展示了其在任务和具有不同时间间隔的输入图像数量上的适应性和泛化性,突出了其在临床应用中实现稳健性能的能力。我们已在https://github.com/emilykaczmarek/SSL-AD上公开发布了我们的代码和模型。
🔬 方法详解
问题定义:阿尔茨海默病预测任务面临数据量不足、模型泛化性差的问题。现有模型难以适应不同数据集、不同扫描次数以及扫描间隔变化的情况,限制了其在临床上的应用。
核心思路:利用自监督学习(SSL)从大量无标签的脑部MRI数据中学习通用的时空特征表示。通过预训练,模型可以更好地泛化到不同的下游任务和数据集,并能适应变长的输入序列。
技术框架:该方法基于3D脑部MRI数据,采用时序自监督学习框架。首先,利用四个公开数据集进行预训练。然后,将预训练的模型应用于多个下游任务,包括诊断分类、转换检测和未来转换预测。整体流程包括数据预处理、自监督预训练和下游任务微调三个阶段。
关键创新:主要创新在于将时序自监督学习方法应用于3D脑部MRI数据,并针对阿尔茨海默病预测任务进行了改进。具体包括:1) 扩展了现有的时序SSL方法,使其能够处理变长的输入序列;2) 设计了新的损失函数,以学习更鲁棒的空间特征表示;3) 结合了时间顺序预测和对比学习,进一步提升了模型的性能。
关键设计:论文采用了时间顺序预测和对比学习两种自监督学习策略。时间顺序预测旨在学习MRI扫描的时间顺序关系,而对比学习则旨在学习不同扫描之间的相似性和差异性。具体而言,模型使用3D卷积神经网络提取空间特征,然后使用循环神经网络(RNN)或Transformer等模型学习时间特征。损失函数包括时间顺序预测损失和对比学习损失。具体网络结构和参数设置在论文中有详细描述。
🖼️ 关键图片
📊 实验亮点
实验结果表明,基于时空自监督学习的SSL-AD模型在七个下游任务中的六个上优于监督学习方法。该模型在诊断分类、转换检测和未来转换预测等任务上均取得了显著的性能提升,证明了其在阿尔茨海默病预测任务中的有效性和优越性。此外,该模型还展现出良好的泛化能力,能够适应不同数据集和不同扫描间隔的情况。
🎯 应用场景
该研究成果可应用于阿尔茨海默病的早期诊断、病情预测和治疗方案制定。通过利用大量的无标签MRI数据进行自监督学习,可以提高模型的泛化能力和适应性,从而更好地服务于临床实践。未来,该方法还可以扩展到其他神经退行性疾病的预测和诊断。
📄 摘要(原文)
Alzheimer's disease is a progressive, neurodegenerative disorder that causes memory loss and cognitive decline. While there has been extensive research in applying deep learning models to Alzheimer's prediction tasks, these models remain limited by lack of available labeled data, poor generalization across datasets, and inflexibility to varying numbers of input scans and time intervals between scans. In this study, we adapt three state-of-the-art temporal self-supervised learning (SSL) approaches for 3D brain MRI analysis, and add novel extensions designed to handle variable-length inputs and learn robust spatial features. We aggregate four publicly available datasets comprising 3,161 patients for pre-training, and show the performance of our model across multiple Alzheimer's prediction tasks including diagnosis classification, conversion detection, and future conversion prediction. Importantly, our SSL model implemented with temporal order prediction and contrastive learning outperforms supervised learning on six out of seven downstream tasks. It demonstrates adaptability and generalizability across tasks and number of input images with varying time intervals, highlighting its capacity for robust performance across clinical applications. We release our code and model publicly at https://github.com/emilykaczmarek/SSL-AD.