LymphAtlas- A Unified Multimodal Lymphoma Imaging Repository Delivering AI-Enhanced Diagnostic Insight

📄 arXiv: 2504.20454v2 📥 PDF

作者: Jiajun Ding, Beiyao Zhu, Xiaosheng Liu, Lishen Zhang, Zhao Liu

分类: eess.IV, cs.CV

发布日期: 2025-04-29 (更新: 2025-12-05)

备注: 12 pages,3 figures

🔗 代码/项目: GITHUB


💡 一句话要点

构建LymphAtlas淋巴瘤多模态影像数据集,实现AI增强的诊断洞察

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 淋巴瘤 PET/CT 多模态影像 数据集 深度学习 图像分割 nnUNet

📋 核心要点

  1. 血液肿瘤领域缺乏标准化的多模态影像分割数据集,限制了AI辅助诊断的发展。
  2. 构建包含PET/CT信息的3D淋巴瘤分割数据集,为深度学习模型提供高质量训练数据。
  3. 实验验证了基于该数据集训练的深度学习模型在淋巴瘤病灶分割中具有高精度和鲁棒性。

📝 摘要(中文)

本研究整合了PET代谢信息与CT解剖结构,建立了一个基于全身FDG PET/CT检查的淋巴瘤3D多模态分割数据集,填补了血液系统恶性肿瘤领域缺乏标准化多模态分割数据集的空白。我们回顾性地收集了2011年3月至2024年5月期间获得的483个检查数据集,涉及220名患者(106名非霍奇金淋巴瘤,42名霍奇金淋巴瘤);所有数据均经过伦理审查并严格去标识化。在数据采集、预处理和标注过程中,完整保留了3D结构信息,并基于nnUNet格式构建了高质量数据集。通过对预处理过程、标注质量和自动分割算法的系统技术验证和评估,验证了基于该数据集训练的深度学习模型能够高精度、高鲁棒性和可重复性地实现PET/CT图像中淋巴瘤病灶的精确分割,证明了该数据集在精确分割和定量分析中的适用性和稳定性。该数据集实现的PET/CT图像深度融合不仅显著提高了肿瘤病灶形态、位置和代谢特征的精确刻画,而且为早期诊断、临床分期和个体化治疗提供了坚实的数据支持,并促进了基于深度学习的自动图像分割和精准医学的发展。该数据集及相关资源可在https://github.com/SuperD0122/LymphAtlas- 获取。

🔬 方法详解

问题定义:该论文旨在解决淋巴瘤影像分析中缺乏高质量、标准化的多模态分割数据集的问题。现有方法依赖于单模态信息或小规模数据集,难以充分利用PET/CT的互补优势,限制了AI模型在淋巴瘤诊断、分期和治疗中的应用。

核心思路:论文的核心思路是构建一个大规模、多模态(PET/CT)的淋巴瘤影像数据集,并采用标准化的数据格式(nnUNet)和严格的质量控制流程,确保数据的可用性和可靠性。通过该数据集训练深度学习模型,实现淋巴瘤病灶的精确分割和定量分析。

技术框架:该研究的技术框架主要包括以下几个阶段:1) 数据收集:回顾性收集483个PET/CT检查数据集,涉及220名淋巴瘤患者。2) 数据预处理:对数据进行去标识化、配准、重采样等预处理操作,保证数据的一致性和可用性。3) 数据标注:由专业医生进行淋巴瘤病灶的3D分割标注,确保标注的准确性和一致性。4) 模型训练与验证:基于nnUNet框架训练深度学习模型,并采用交叉验证等方法评估模型的性能。5) 数据集发布:将数据集和相关资源发布到GitHub,供研究人员使用。

关键创新:该论文的关键创新在于构建了一个大规模、高质量的淋巴瘤多模态影像数据集,并采用标准化的数据格式和严格的质量控制流程。该数据集填补了血液肿瘤领域缺乏标准化多模态分割数据集的空白,为AI辅助淋巴瘤诊断和治疗提供了重要的数据基础。

关键设计:该研究的关键设计包括:1) 采用nnUNet框架,简化了模型训练和部署流程。2) 采用严格的质量控制流程,包括数据预处理、标注质量评估和模型性能验证,确保数据的可用性和可靠性。3) 将数据集和相关资源发布到GitHub,促进了研究成果的共享和应用。

📊 实验亮点

该研究构建的LymphAtlas数据集包含483个PET/CT检查数据集,涉及220名淋巴瘤患者,是目前最大的淋巴瘤多模态影像数据集之一。实验结果表明,基于该数据集训练的深度学习模型能够高精度、高鲁棒性和可重复性地实现PET/CT图像中淋巴瘤病灶的精确分割,证明了该数据集在精确分割和定量分析中的适用性和稳定性。

🎯 应用场景

该研究成果可应用于淋巴瘤的早期诊断、临床分期、疗效评估和个体化治疗。通过AI自动分割淋巴瘤病灶,可以提高诊断效率和准确性,减少医生工作量。此外,该数据集还可以用于开发新的AI算法,促进淋巴瘤精准医学的发展,为患者提供更有效的治疗方案。

📄 摘要(原文)

This study integrates PET metabolic information with CT anatomical structures to establish a 3D multimodal segmentation dataset for lymphoma based on whole-body FDG PET/CT examinations, which bridges the gap of the lack of standardised multimodal segmentation datasets in the field of haematological malignancies. We retrospectively collected 483 examination datasets acquired between March 2011 and May 2024, involving 220 patients (106 non-Hodgkin lymphoma, 42 Hodgkin lymphoma); all data underwent ethical review and were rigorously de-identified. Complete 3D structural information was preserved during data acquisition, preprocessing and annotation, and a high-quality dataset was constructed based on the nnUNet format. By systematic technical validation and evaluation of the preprocessing process, annotation quality and automatic segmentation algorithm, the deep learning model trained based on this dataset is verified to achieve accurate segmentation of lymphoma lesions in PET/CT images with high accuracy, good robustness and reproducibility, which proves the applicability and stability of this dataset in accurate segmentation and quantitative analysis. The deep fusion of PET/CT images achieved with this dataset not only significantly improves the accurate portrayal of the morphology, location and metabolic features of tumour lesions, but also provides solid data support for early diagnosis, clinical staging and personalized treatment, and promotes the development of automated image segmentation and precision medicine based on deep learning. The dataset and related resources are available at https://github.com/SuperD0122/LymphAtlas-.