Reducing Overtreatment of Indeterminate Thyroid Nodules Using a Multimodal Deep Learning Model

作者: Shreeram Athreya, Andrew Melehy, Sujit Silas Armstrong Suthahar, Vedrana Ivezić, Ashwath Radhachandran, Vivek Sant, Chace Moleta, Henry Zheng, Maitraya Patel, Rinat Masamed, Corey W. Arnold, William Speier

分类: q-bio.QM, cs.LG, eess.IV

发布日期: 2024-09-27

备注: 9 pages, 3 figures

💡 一句话要点

多模态深度学习模型提升甲状腺结节良恶性预测，减少过度治疗

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 甲状腺结节 多模态学习 深度学习 注意力机制 医学影像 分子检测 辅助诊断

📋 核心要点

分子检测对不确定性甲状腺结节的良恶性分类存在假阳性率高的问题，导致过度治疗。
提出一种多模态深度学习AMIL模型，融合超声图像和分子检测结果，提升结节良恶性预测的准确性。
实验结果表明，该模型在保持高敏感性的同时，显著提高了阳性预测值，减少了假阳性。

📝 摘要（中文）

本研究旨在解决分子检测（MT）在细胞学不确定性甲状腺结节分类中假阳性率高的问题。现有MT方法仅依赖分子特征，忽略了超声（US）图像和活检信息。为此，我们提出了一种多模态深度学习模型，将注意力多示例学习（AMIL）应用于US图像。该模型结合US图像和MT数据，对甲状腺结节进行良恶性分类，从而提高MT的恶性风险分层能力。在UCLA医疗中心回顾性分析的333例不确定性甲状腺结节患者数据（259例良性，74例恶性）上进行实验，结果表明，该AMIL模型在保持MT敏感性（0.946）的同时，显著提高了阳性预测值（PPV）（0.477 vs 0.448，MT单独使用）。该方法在维持高敏感性的前提下，减少了假阳性，从而有可能减少不必要的良性甲状腺切除。

🔬 方法详解

问题定义：分子检测（MT）虽然对细胞学不确定性甲状腺结节的良恶性分类具有高敏感性，但阳性预测值（PPV）较低，这意味着存在较高的假阳性率，导致不必要的良性甲状腺切除。现有MT方法仅依赖分子特征，忽略了超声（US）图像等其他重要信息。

核心思路：本研究的核心思路是将超声图像信息融入到甲状腺结节的良恶性预测中，利用深度学习模型学习US图像中的特征，并结合分子检测结果，从而提高预测的准确性，降低假阳性率。通过多模态融合，弥补单一分子检测的不足。

技术框架：该研究采用多模态深度学习框架，主要包含以下几个模块：1) 超声图像特征提取模块：使用卷积神经网络（CNN）提取US图像的特征表示。2) 注意力多示例学习（AMIL）模块：利用AMIL机制，从US图像的多个切片中选择与结节良恶性判断最相关的切片，并赋予更高的权重。3) 分子检测特征编码模块：对分子检测结果进行编码，形成特征向量。4) 融合分类模块：将US图像特征和分子检测特征进行融合，输入到分类器中，预测结节的良恶性。

关键创新：该研究的关键创新在于将注意力多示例学习（AMIL）应用于超声图像分析，并将其与分子检测结果进行多模态融合。AMIL能够有效地从多个US图像切片中提取关键信息，提高模型的鲁棒性和准确性。此外，多模态融合能够充分利用不同模态的信息，弥补单一模态的不足。

关键设计：模型使用了预训练的卷积神经网络作为超声图像特征提取器。注意力多示例学习模块使用门控注意力机制，自动学习每个US图像切片的权重。损失函数采用二元交叉熵损失函数，用于优化模型的分类性能。分子检测特征的编码方式未知，论文中未详细描述。

🖼️ 关键图片

📊 实验亮点

实验结果表明，该AMIL模型在保持MT敏感性（0.946）的同时，显著提高了阳性预测值（PPV）（0.477 vs 0.448，MT单独使用）。这意味着在不降低恶性结节检出率的前提下，减少了假阳性，从而降低了不必要的良性甲状腺切除的可能性。

🎯 应用场景

该研究成果可应用于临床甲状腺结节的良恶性辅助诊断，帮助医生更准确地评估结节的风险，减少不必要的良性甲状腺切除手术，降低患者的医疗负担和手术风险。未来，该方法可以推广到其他疾病的诊断中，例如乳腺结节、肺结节等。

📄 摘要（原文）

Objective: Molecular testing (MT) classifies cytologically indeterminate thyroid nodules as benign or malignant with high sensitivity but low positive predictive value (PPV), only using molecular profiles, ignoring ultrasound (US) imaging and biopsy. We address this limitation by applying attention multiple instance learning (AMIL) to US images. Methods: We retrospectively reviewed 333 patients with indeterminate thyroid nodules at UCLA medical center (259 benign, 74 malignant). A multi-modal deep learning AMIL model was developed, combining US images and MT to classify the nodules as benign or malignant and enhance the malignancy risk stratification of MT. Results: The final AMIL model matched MT sensitivity (0.946) while significantly improving PPV (0.477 vs 0.448 for MT alone), indicating fewer false positives while maintaining high sensitivity. Conclusion: Our approach reduces false positives compared to MT while maintaining the same ability to identify positive cases, potentially reducing unnecessary benign thyroid resections in patients with indeterminate nodules.

Reducing Overtreatment of Indeterminate Thyroid Nodules Using a Multimodal Deep Learning Model

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理