ISLES'24 -- A Real-World Longitudinal Multimodal Stroke Dataset
作者: Evamaria Olga Riedel, Ezequiel de la Rosa, The Anh Baran, Moritz Hernandez Petzsche, Hakim Baazaoui, Kaiyuan Yang, Fabio Antonio Musio, Houjing Huang, David Robben, Joaquin Oscar Seia, Roland Wiest, Mauricio Reyes, Ruisheng Su, Claus Zimmer, Tobias Boeckh-Behrens, Maria Berndt, Bjoern Menze, Daniel Rueckert, Benedikt Wiestler, Susanne Wegener, Jan Stefan Kirschke
分类: cs.CV
发布日期: 2024-08-20 (更新: 2025-07-06)
💡 一句话要点
ISLES'24发布真实世界纵向多模态卒中数据集,助力机器学习算法开发。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 卒中 数据集 纵向研究 多模态成像 机器学习 病灶分割 预后预测
📋 核心要点
- 现有卒中图像数据集缺乏纵向信息,限制了机器学习算法在病灶识别和预后预测方面的能力。
- 论文构建了一个包含CT、MRI和临床数据的纵向多模态卒中数据集,覆盖急性期到三个月随访。
- 该数据集包含血管闭塞和梗死掩模,为开发和评估卒中诊断和预后预测算法提供了基础。
📝 摘要(中文)
卒中是全球发病率和死亡率的主要原因,造成沉重的社会经济负担。血管内再灌注治疗以及CT和MR成像在治疗指导方面的进展显著改善了患者的预后。开发能够从卒中图像创建精确大脑功能模型的机器学习算法,用于病灶识别和组织存活预测等任务,需要大型、多样化且良好标注的公共数据集。虽然现有一些高质量的卒中图像数据集,但它们仅包含单一时间点的数据。不同时间点的数据对于准确识别病灶和预测预后至关重要。本文提供全面的纵向卒中数据,包括(亚)急性CT成像(含血管造影和灌注)、2-9天后的随访MRI,以及长达三个月预后的急性和纵向临床数据。该数据集还包括急性CT血管造影的血管闭塞掩模和随访MRI中描绘的梗死掩模。这个多中心数据集包含245个病例,是开发强大的机器学习算法以促进临床决策的坚实基础。
🔬 方法详解
问题定义:现有卒中图像数据集主要集中在单一时间点的数据,缺乏对卒中演变过程的追踪。这限制了机器学习模型在准确识别病灶、预测组织存活以及评估长期预后方面的能力。因此,需要一个包含多时间点、多模态信息的卒中数据集,以支持更深入的研究和算法开发。
核心思路:论文的核心思路是构建一个真实世界的纵向多模态卒中数据集,该数据集包含从急性期到三个月随访的CT、MRI和临床数据。通过提供不同时间点的图像和临床信息,研究人员可以更好地了解卒中的演变过程,并开发更准确的诊断和预后预测模型。
技术框架:该数据集包含以下几个主要组成部分:1) 急性期CT成像,包括血管造影和灌注;2) 2-9天后的随访MRI;3) 急性和纵向临床数据,包括三个月的预后信息;4) 急性CT血管造影的血管闭塞掩模;5) 随访MRI中描绘的梗死掩模。这些数据来自多个中心,涵盖了245个病例。
关键创新:该数据集的关键创新在于其纵向性和多模态性。与现有的卒中数据集相比,该数据集提供了更全面的信息,可以用于研究卒中的动态演变过程。此外,该数据集还包含了血管闭塞和梗死掩模,这为算法开发提供了有价值的标注信息。
关键设计:数据集的构建涉及多个中心的合作,确保了数据的多样性和代表性。数据采集和标注过程遵循标准化的流程,以保证数据质量。数据集的规模为245个病例,为机器学习算法的训练和评估提供了充足的数据量。具体参数设置和数据预处理方法在论文中未详细说明,属于未知信息。
📊 实验亮点
该数据集包含245个病例,涵盖了从急性期到三个月随访的CT、MRI和临床数据。与现有数据集相比,该数据集提供了更全面的纵向信息,并包含了血管闭塞和梗死掩模。该数据集为开发更强大的卒中诊断和预后预测算法奠定了基础,但具体的性能数据和对比基线需要在后续研究中进行评估。
🎯 应用场景
该数据集可用于开发和评估各种卒中相关的机器学习算法,例如病灶自动分割、组织存活预测、预后评估等。这些算法可以帮助临床医生更快速、准确地诊断和治疗卒中,改善患者的预后。此外,该数据集还可以用于研究卒中的病理生理机制,为新的治疗方法开发提供理论基础。
📄 摘要(原文)
Stroke remains a leading cause of global morbidity and mortality, imposing a heavy socioeconomic burden. Advances in endovascular reperfusion therapy and CT and MR imaging for treatment guidance have significantly improved patient outcomes. Developing machine learning algorithms that can create accurate models of brain function from stroke images for tasks like lesion identification and tissue survival prediction requires large, diverse, and well annotated public datasets. While several high-quality image datasets in stroke exist, they include only single time point data. Data over different time points are essential to accurately identify lesions and predict prognosis. Here, we provide comprehensive longitudinal stroke data, including (sub-)acute CT imaging with angiography and perfusion, follow-up MRI after 2-9 days, and acute and longitudinal clinical data up to a three-month outcome. The dataset also includes vessel occlusion masks from acute CT angiography and delineated infarction masks in follow-up MRI. This multicenter dataset consists of 245 cases and is a solid basis for developing powerful machine-learning algorithms to facilitate clinical decision-making.