An Explainable Neural Radiomic Sequence Model with Spatiotemporal Continuity for Quantifying 4DCT-based Pulmonary Ventilation

📄 arXiv: 2503.23898v2 📥 PDF

作者: Rihui Zhang, Haiming Zhu, Jingtong Zhao, Lei Zhang, Fang-Fang Yin, Chunhao Wang, Zhenyu Yang

分类: physics.med-ph, cs.CV

发布日期: 2025-03-31 (更新: 2025-07-20)

备注: 43 pages, 13 figures


💡 一句话要点

提出时序显著性增强的可解释神经放射组学模型,用于量化4DCT肺部通气

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 肺部通气 4DCT 放射组学 LSTM 时间序列 可解释性 肺癌 深度学习

📋 核心要点

  1. 肺部区域通气的精确评估对肺癌患者的管理和治疗至关重要,但现有核医学方法耗时、昂贵且有辐射。
  2. 提出一种基于4DCT的可解释神经放射组学序列模型,通过时序显著性增强的LSTM网络识别通气受损区域。
  3. 实验结果表明,该模型在PET和SPECT数据集上均取得了0.78的Dice相似系数,并能解释关键的放射组学特征。

📝 摘要(中文)

本研究提出了一种可解释的神经放射组学序列模型,用于基于四维计算机断层扫描(4DCT)识别肺部通气受损区域。分析了来自VAMPIRE数据集的45例肺癌患者。对于每位患者,从4DCT分割肺部容积,并在整个呼吸周期中提取体素级的放射组学特征(56维),以捕获局部强度和纹理动态,形成时间放射组学序列。使用Galligas-PET和DTPA-SPECT以体素方式描绘出真实的通气缺陷。为了识别受损区域,我们开发了一种在放射组学序列上训练的时序显著性增强的可解释长短期记忆(LSTM)网络。生成时间显著性图,以突出显示有助于模型预测的关键特征。所提出的模型表现出强大的性能,对于25个PET病例,平均(范围)Dice相似系数为0.78(0.74-0.79),对于20个SPECT病例,平均(范围)Dice相似系数为0.78(0.74-0.82)。时间显著性图解释了通气量化中的三个关键放射组学序列:在肺部呼气期间,受损的肺功能区域通常表现出(1)强度增加的趋势和(2)均匀性降低的趋势,这与健康的肺组织相反。

🔬 方法详解

问题定义:论文旨在解决肺癌患者肺部通气功能评估的问题。现有方法,如核医学通气闪烁扫描,存在耗时、成本高昂以及患者暴露于额外辐射的缺点。因此,需要一种更高效、无创且准确的方法来评估肺部通气情况。

核心思路:论文的核心思路是利用4DCT图像中的放射组学特征,结合深度学习模型,来预测肺部通气功能。通过分析呼吸周期内体素级别的放射组学特征变化,捕捉肺部通气受损区域的特征模式。同时,引入时间显著性机制,增强模型的可解释性,从而理解模型预测的关键因素。

技术框架:整体框架包括以下几个主要步骤:1) 从4DCT图像中分割肺部容积;2) 提取体素级别的放射组学特征,形成时间序列;3) 构建基于LSTM的时序显著性增强模型,用于预测通气缺陷;4) 生成时间显著性图,解释模型预测的关键特征。

关键创新:该论文的关键创新在于:1) 提出了一种基于时序显著性增强的LSTM网络,能够有效利用4DCT图像中的时序放射组学信息进行肺部通气功能评估;2) 通过时间显著性图,实现了模型预测的可解释性,能够揭示影响肺部通气功能的关键放射组学特征;3) 将放射组学特征与深度学习相结合,为肺部疾病的诊断和治疗提供了新的思路。

关键设计:论文中,放射组学特征提取了56维特征,涵盖了强度和纹理信息。LSTM网络用于处理时序数据,并通过时间显著性机制来学习不同时间步长的重要性。损失函数未知,但目标是优化模型预测的Dice相似系数。

📊 实验亮点

该模型在VAMPIRE数据集的45例肺癌患者数据上进行了验证,分别在25个PET病例和20个SPECT病例上取得了平均Dice相似系数0.78(范围0.74-0.79)和0.78(范围0.74-0.82)的良好性能。时间显著性图揭示了肺部呼气期间,受损区域强度增加和均匀性降低的关键特征。

🎯 应用场景

该研究成果可应用于肺癌患者的肺功能评估、治疗方案优化和疗效监测。通过无创的4DCT图像分析,可以更准确地识别肺部通气受损区域,为临床医生提供更全面的信息,从而制定更个性化的治疗方案。此外,该方法还可用于其他肺部疾病的诊断和评估,具有广泛的应用前景。

📄 摘要(原文)

Accurate evaluation of regional lung ventilation is essential for the management and treatment of lung cancer patients, supporting assessments of pulmonary function, optimization of therapeutic strategies, and monitoring of treatment response. Currently, ventilation scintigraphy using nuclear medicine techniques is widely employed in clinical practice; however, it is often time-consuming, costly, and entails additional radiation exposure. In this study, we propose an explainable neural radiomic sequence model to identify regions of compromised pulmonary ventilation based on four-dimensional computed tomography (4DCT). A cohort of 45 lung cancer patients from the VAMPIRE dataset was analyzed. For each patient, lung volumes were segmented from 4DCT, and voxel-wise radiomic features (56-dimensional) were extracted across the respiratory cycle to capture local intensity and texture dynamics, forming temporal radiomic sequences. Ground truth ventilation defects were delineated voxel-wise using Galligas-PET and DTPA-SPECT. To identify compromised regions, we developed a temporal saliency-enhanced explainable long short-term memory (LSTM) network trained on the radiomic sequences. Temporal saliency maps were generated to highlight key features contributing to the model's predictions. The proposed model demonstrated robust performance, achieving average (range) Dice similarity coefficients of 0.78 (0.74-0.79) for 25 PET cases and 0.78 (0.74-0.82) for 20 SPECT cases. The temporal saliency map explained three key radiomic sequences in ventilation quantification: during lung exhalation, compromised pulmonary function region typically exhibits (1) an increasing trend of intensity and (2) a decreasing trend of homogeneity, in contrast to healthy lung tissue.