Toward a robust lesion detection model in breast DCE-MRI: adapting foundation models to high-risk women
作者: Gabriel A. B. do Nascimento, Vincent Dong, Guilherme J. Cavalcante, Alex Nguyen, Thaís G. do Rêgo, Yuri Malheiros, Telmo M. Silva Filho, Carla R. Zeballos Torrez, James C. Gee, Anne Marie McCarthy, Andrew D. A. Maidment, Bruno Barufaldi
分类: physics.med-ph, cs.CV, cs.LG
发布日期: 2025-09-02
💡 一句话要点
针对高危女性,提出结合MST和KAN的乳腺DCE-MRI病灶检测模型。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 乳腺MRI 病灶检测 深度学习 基础模型 自监督学习 Kolmogorov-Arnold Network DCE-MRI
📋 核心要点
- 乳腺MRI病灶检测对于早期癌症诊断至关重要,尤其是在高危人群中,现有方法在处理不平衡和异构数据时面临挑战。
- 论文提出将预训练的Medical Slice Transformer (MST)与Kolmogorov-Arnold Network (KAN)相结合,利用MST提取鲁棒特征,KAN进行灵活分类。
- 实验结果表明,MST+KAN流程在乳腺病灶分类任务中优于基线MST分类器,AUC达到0.80 ± 0.02,并保持了模型的可解释性。
📝 摘要(中文)
本研究提出了一种分类流程,该流程利用预训练的基础模型Medical Slice Transformer (MST),用于动态对比增强MRI (DCE-MRI)的乳腺病灶分类,尤其针对高危人群。MST利用基于DINOv2的自监督预训练,生成鲁棒的每切片特征嵌入,然后用于训练Kolmogorov-Arnold Network (KAN)分类器。KAN通过自适应B样条激活实现局部非线性变换,为传统卷积网络提供了一种灵活且可解释的替代方案。这增强了模型在不平衡和异构临床数据集中区分良性和恶性病变的能力。实验结果表明,MST+KAN流程优于基线MST分类器,实现了AUC = 0.80 ± 0.02,同时通过基于注意力的热图保留了可解释性。研究结果强调了结合基础模型嵌入和高级分类策略在构建鲁棒且通用的乳腺MRI分析工具方面的有效性。
🔬 方法详解
问题定义:论文旨在解决乳腺DCE-MRI图像中病灶检测的准确性问题,尤其是在高危女性人群中。现有方法在处理临床数据集中常见的不平衡和异构性时表现不佳,难以有效区分良性和恶性病灶。
核心思路:论文的核心思路是利用预训练的基础模型MST提取图像的鲁棒特征,并结合KAN分类器进行灵活的非线性分类。MST通过自监督学习获得强大的特征表示能力,KAN则能够自适应地学习局部非线性变换,从而更好地适应复杂的数据分布。
技术框架:整体流程包括两个主要阶段:1) 特征提取阶段:使用预训练的MST模型对DCE-MRI图像的每个切片进行特征提取,得到每切片的特征嵌入。2) 分类阶段:将提取的特征嵌入输入到KAN分类器中进行训练和预测,KAN输出病灶的良恶性概率。
关键创新:论文的关键创新在于将MST基础模型与KAN分类器相结合。MST提供了强大的特征表示能力,而KAN则提供了灵活的非线性分类能力,两者结合能够更好地适应乳腺DCE-MRI数据的复杂性和异构性。此外,KAN本身也提供了一种可解释的分类方式,有助于医生理解模型的决策过程。
关键设计:MST模型使用DINOv2进行自监督预训练,以获得更好的特征表示能力。KAN分类器使用自适应B样条激活函数,能够学习局部非线性变换。损失函数方面,论文可能使用了交叉熵损失函数或其他适用于分类任务的损失函数。具体的网络结构细节,例如MST和KAN的层数、神经元数量等,可能在论文中有更详细的描述。
🖼️ 关键图片
📊 实验亮点
实验结果表明,MST+KAN流程在乳腺病灶分类任务中取得了显著的性能提升,AUC达到0.80 ± 0.02,优于基线MST分类器。这一结果表明,结合基础模型嵌入和高级分类策略能够有效提高乳腺MRI分析的准确性和鲁棒性。同时,模型的可解释性也得到了保留,为临床应用提供了保障。
🎯 应用场景
该研究成果可应用于乳腺癌的早期诊断和筛查,尤其是在高危女性人群中。通过提高病灶检测的准确性和效率,可以帮助医生更早地发现和治疗乳腺癌,从而改善患者的预后。此外,该方法的可解释性也有助于医生理解模型的决策过程,增强对诊断结果的信心。
📄 摘要(原文)
Accurate breast MRI lesion detection is critical for early cancer diagnosis, especially in high-risk populations. We present a classification pipeline that adapts a pretrained foundation model, the Medical Slice Transformer (MST), for breast lesion classification using dynamic contrast-enhanced MRI (DCE-MRI). Leveraging DINOv2-based self-supervised pretraining, MST generates robust per-slice feature embeddings, which are then used to train a Kolmogorov--Arnold Network (KAN) classifier. The KAN provides a flexible and interpretable alternative to conventional convolutional networks by enabling localized nonlinear transformations via adaptive B-spline activations. This enhances the model's ability to differentiate benign from malignant lesions in imbalanced and heterogeneous clinical datasets. Experimental results demonstrate that the MST+KAN pipeline outperforms the baseline MST classifier, achieving AUC = 0.80 \pm 0.02 while preserving interpretability through attention-based heatmaps. Our findings highlight the effectiveness of combining foundation model embeddings with advanced classification strategies for building robust and generalizable breast MRI analysis tools.