Cardiovascular Disease Detection from Multi-View Chest X-rays with BI-Mamba
作者: Zefan Yang, Jiajin Zhang, Ge Wang, Mannudeep K. Kalra, Pingkun Yan
分类: eess.IV, cs.CV
发布日期: 2024-05-28
备注: Early accepted paper for MICCAI 2024
💡 一句话要点
提出BI-Mamba,利用多视角胸部X光片进行心血管疾病风险预测,降低辐射暴露。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 心血管疾病预测 胸部X光片 双向Mamba 状态空间模型 深度学习 医学影像分析 低辐射诊断
📋 核心要点
- 现有方法依赖CT影像进行心血管疾病风险预测,但CT辐射暴露较高,对患者健康存在潜在风险。
- 提出BI-Mamba模型,利用双向状态空间模型捕捉多视角胸部X光片的远程依赖关系,降低辐射风险。
- 实验结果表明,BI-Mamba在性能上优于ResNet-50和ViT-S,并节省了GPU内存,接近CT影像的预测水平。
📝 摘要(中文)
准确预测医学影像中的心血管疾病(CVD)风险对于有效的患者健康管理至关重要。以往研究表明,计算机断层扫描(CT)中的影像特征有助于预测CVD风险。然而,CT会产生显著的辐射暴露,可能对患者的健康产生不利影响。相比之下,胸部X光片的辐射水平显著降低,提供了一种更安全的选择。因此,我们研究了使用胸部X光片预测CVD风险的可行性。卷积神经网络(CNN)和Transformer是两种成熟的计算机辅助诊断网络架构。然而,由于缺乏大型上下文建模能力或二次时间复杂度,它们难以处理超高分辨率的胸部X光片。受到状态空间序列模型(SSM)的启发,SSM是一种具有与Transformer竞争的序列建模能力和线性时间复杂度的新型网络架构。我们提出了双向图像Mamba(BI-Mamba),以互补单向SSM的相反方向信息。BI-Mamba利用并行前向和后向块来编码多视角胸部X光片的远程依赖关系。我们在来自国家肺部筛查试验(NLST)的10395名受试者的图像上进行了广泛的实验。结果表明,BI-Mamba在参数大小相当的情况下优于ResNet-50和ViT-S,并在训练期间节省了大量的GPU内存。此外,与以往CT领域的state-of-the-art方法相比,BI-Mamba取得了有希望的性能,揭示了胸部X光片在CVD风险预测方面的潜力。
🔬 方法详解
问题定义:论文旨在解决使用低辐射的胸部X光片进行心血管疾病(CVD)风险预测的问题。现有方法主要依赖CT影像,虽然预测精度较高,但CT扫描带来的辐射暴露对患者健康构成威胁。传统CNN和Transformer模型在处理高分辨率胸部X光片时,要么缺乏长程依赖建模能力,要么计算复杂度过高,难以有效应用。
核心思路:论文的核心思路是利用状态空间序列模型(SSM)的变体——Mamba,其具有线性时间复杂度和强大的序列建模能力,能够有效处理高分辨率图像的长程依赖关系。通过构建双向Mamba结构(BI-Mamba),模型可以同时从两个方向捕捉图像信息,从而更全面地理解图像内容,提升预测精度。
技术框架:BI-Mamba模型的整体架构包括以下几个主要部分:1) 输入多视角胸部X光片;2) 并行前向和后向Mamba块,用于编码图像的远程依赖关系;3) 将前向和后向Mamba块的输出进行融合;4) 通过分类器预测CVD风险。模型采用端到端的训练方式,直接优化CVD风险预测的准确性。
关键创新:论文的关键创新在于提出了BI-Mamba模型,将双向状态空间模型应用于胸部X光片的心血管疾病风险预测。与传统的单向SSM相比,BI-Mamba能够更全面地捕捉图像信息,提升预测精度。此外,BI-Mamba的线性时间复杂度使其能够有效处理高分辨率图像,克服了传统CNN和Transformer模型的局限性。
关键设计:BI-Mamba的关键设计包括:1) 使用并行的前向和后向Mamba块,以捕捉图像的双向依赖关系;2) 采用合适的融合策略,将前向和后向Mamba块的输出进行有效整合;3) 针对CVD风险预测任务,设计合适的分类器和损失函数。具体的参数设置和网络结构细节在论文中进行了详细描述。
🖼️ 关键图片
📊 实验亮点
实验结果表明,BI-Mamba在NLST数据集上取得了显著的性能提升。与ResNet-50和ViT-S相比,BI-Mamba在参数量相当的情况下,预测精度更高,并且在训练过程中节省了大量的GPU内存。此外,BI-Mamba的性能接近甚至超过了以往基于CT影像的state-of-the-art方法,证明了胸部X光片在CVD风险预测方面的潜力。
🎯 应用场景
该研究成果可应用于心血管疾病的早期筛查和风险评估,尤其适用于需要避免高辐射暴露的患者。通过使用低辐射的胸部X光片,可以降低患者的健康风险,并为医生提供辅助诊断信息,提高诊断效率和准确性。该技术具有广泛的应用前景,有望在医疗健康领域发挥重要作用。
📄 摘要(原文)
Accurate prediction of Cardiovascular disease (CVD) risk in medical imaging is central to effective patient health management. Previous studies have demonstrated that imaging features in computed tomography (CT) can help predict CVD risk. However, CT entails notable radiation exposure, which may result in adverse health effects for patients. In contrast, chest X-ray emits significantly lower levels of radiation, offering a safer option. This rationale motivates our investigation into the feasibility of using chest X-ray for predicting CVD risk. Convolutional Neural Networks (CNNs) and Transformers are two established network architectures for computer-aided diagnosis. However, they struggle to model very high resolution chest X-ray due to the lack of large context modeling power or quadratic time complexity. Inspired by state space sequence models (SSMs), a new class of network architectures with competitive sequence modeling power as Transfomers and linear time complexity, we propose Bidirectional Image Mamba (BI-Mamba) to complement the unidirectional SSMs with opposite directional information. BI-Mamba utilizes parallel forward and backwark blocks to encode longe-range dependencies of multi-view chest X-rays. We conduct extensive experiments on images from 10,395 subjects in National Lung Screening Trail (NLST). Results show that BI-Mamba outperforms ResNet-50 and ViT-S with comparable parameter size, and saves significant amount of GPU memory during training. Besides, BI-Mamba achieves promising performance compared with previous state of the art in CT, unraveling the potential of chest X-ray for CVD risk prediction.