Quantum Kernel Advantage over Classical Collapse in Medical Foundation Model Embeddings

作者: Sebastian Cajas Ordóñez, Felipe Ocampo Osorio, Dax Enshan Koh, Rafi Al Attrach, Aldo Marzullo, Ariel Guerra-Adames, J. Alejandro Andrade, Siong Thye Goh, Chi-Yu Chen, Rahul Gorijavolu, Xue Yang, Noah Dane Hebdon, Leo Anthony Celi

分类: quant-ph, cs.AI

发布日期: 2026-04-27

🔗 代码/项目: GITHUB

💡 一句话要点

利用量子核在医学基础模型嵌入上超越经典方法，提升胸部X光片保险分类性能

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 量子核 量子支持向量机 医学图像分类 胸部X光片 类别不平衡 MIMIC-CXR 医学基础模型

📋 核心要点

现有线性SVM在处理医学图像分类任务时，易陷入多数类预测，导致少数类识别率低。
提出一种基于量子核的QSVM方法，利用量子计算的优势，提升模型对少数类的识别能力。
实验表明，QSVM在胸部X光片分类任务中，显著优于线性SVM和RBF SVM，尤其在少数类F1分数上。

📝 摘要（中文）

本文在MIMIC-CXR胸部X光片二元保险分类任务中，验证了量子核在无噪声模拟下的优势。研究使用量子支持向量机（QSVM），并结合三种医学基础模型（MedSigLIP-448、RAD-DINO、ViT-patch32）的冻结嵌入。论文提出了一个两层公平比较框架，其中两个分类器都接收相同的PCA-q特征。在第一层（未调优的QSVM vs. 未调优的线性SVM，C=1），QSVM在所有18个测试配置中都赢得了少数类F1分数（17个p<0.001，1个p<0.01）。经典线性核在每个量子比特数下，90-100%的种子都崩溃为多数类预测，而QSVM保持了非平凡的召回率。在q=11（MedSigLIP-448平台中心），QSVM实现了平均F1=0.343，而经典F1=0.050（F1增益=+0.293，p<0.001），且无需超参数调整。在第二层（未调优的QSVM vs. C调优的RBF SVM），QSVM赢得了所有七个测试配置（平均增益+0.068，最大+0.112）。特征谱分析表明，量子核有效秩在q=11时达到69.80，远超线性核秩，而经典崩溃保持C不变。完整的量子比特扫描揭示了跨模型的架构依赖性集中开始。

🔬 方法详解

问题定义：论文旨在解决医学图像分类中，经典线性核方法易于崩溃到多数类预测的问题，尤其是在处理类别不平衡的数据集时，导致少数类别的识别率极低。现有方法难以有效利用医学图像的复杂特征，限制了分类性能的提升。

核心思路：论文的核心思路是利用量子计算的优势，通过量子核方法，将医学图像的嵌入特征映射到高维量子特征空间，从而提高分类器的判别能力。量子核能够捕捉经典核难以捕捉的复杂数据关系，有效解决类别不平衡问题。

技术框架：整体框架包括以下几个阶段：1) 使用医学基础模型（如MedSigLIP-448、RAD-DINO、ViT-patch32）提取胸部X光片的嵌入特征；2) 对提取的特征进行PCA降维，得到PCA-q特征；3) 使用量子支持向量机（QSVM）进行分类，其中量子核用于计算样本之间的相似度；4) 将QSVM的性能与经典线性SVM和RBF SVM进行比较。

关键创新：最重要的技术创新点在于将量子核方法应用于医学图像分类，并证明了其在处理类别不平衡数据时的优势。与经典核方法相比，量子核能够在高维量子特征空间中更好地分离不同类别的数据，从而提高分类性能。此外，论文还提出了一个两层公平比较框架，确保了QSVM与经典方法的可比性。

关键设计：论文的关键设计包括：1) 使用PCA-q特征作为QSVM的输入，以降低计算复杂度；2) 使用未调优的QSVM与未调优的线性SVM进行比较，以评估量子核的固有优势；3) 使用C调优的RBF SVM作为更强的经典基线，进一步验证QSVM的性能；4) 通过特征谱分析，揭示量子核的有效秩远超线性核，解释了其性能优势。

🖼️ 关键图片

📊 实验亮点

实验结果表明，在MIMIC-CXR数据集上，QSVM在少数类F1分数上显著优于经典线性SVM和RBF SVM。在q=11时，QSVM实现了平均F1=0.343，而经典线性SVM的F1仅为0.050，F1增益高达+0.293（p<0.001）。即使与C调优的RBF SVM相比，QSVM仍然取得了显著的性能提升（平均增益+0.068，最大+0.112）。

🎯 应用场景

该研究成果可应用于医疗诊断辅助系统，提升疾病早期筛查的准确性，尤其是在罕见病或少数病例的识别上。通过量子核方法，可以更有效地利用医学影像数据，为临床决策提供更可靠的依据，具有重要的临床应用价值和潜力。

📄 摘要（原文）

We provide evidence of quantum kernel advantage under noiseless simulation in binary insurance classification on MIMIC-CXR chest radiographs using quantum support vector machines (QSVM) with frozen embeddings from three medical foundation models (MedSigLIP-448, RAD-DINO, ViT-patch32). We propose a two-tier fair comparison framework in which both classifiers receive identical PCA-q features. At Tier 1 (untuned QSVM vs. untuned linear SVM, C = 1 both sides), QSVM wins minority-class F1 in all 18 tested configurations (17 at p < 0.001, 1 at p < 0.01). The classical linear kernel collapses to majority-class prediction on 90-100% of seeds at every qubit count, while QSVM maintains non-trivial recall. At q = 11 (MedSigLIP-448 plateau center), QSVM achieves mean F1 = 0.343 vs. classical F1 = 0.050 (F1 gain = +0.293, p < 0.001) without hyperparameter tuning. Under Tier 2 (untuned QSVM vs. C-tuned RBF SVM), QSVM wins all seven tested configurations (mean gain +0.068, max +0.112). Eigenspectrum analysis reveals quantum kernel effective rank reaches 69.80 at q = 11, far exceeding linear kernel rank, while classical collapse remains C-invariant. A full qubit sweep reveals architecture-dependent concentration onset across models. Code: https://github.com/sebasmos/qml-medimage

Quantum Kernel Advantage over Classical Collapse in Medical Foundation Model Embeddings

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理