Quantum Kernel Advantage over Classical Collapse in Medical Foundation Model Embeddings
作者: Sebastian Cajas Ordóñez, Felipe Ocampo Osorio, Dax Enshan Koh, Rafi Al Attrach, Aldo Marzullo, Ariel Guerra-Adames, J. Alejandro Andrade, Siong Thye Goh, Chi-Yu Chen, Rahul Gorijavolu, Xue Yang, Noah Dane Hebdon, Leo Anthony Celi
分类: quant-ph, cs.AI
发布日期: 2026-04-27
🔗 代码/项目: GITHUB
💡 一句话要点
利用量子核在医学基础模型嵌入上超越经典方法,提升胸部X光片保险分类性能
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 量子核 量子支持向量机 医学图像分类 胸部X光片 类别不平衡 MIMIC-CXR 医学基础模型
📋 核心要点
- 现有线性SVM在处理医学图像分类任务时,易陷入多数类预测,导致少数类识别率低。
- 提出一种基于量子核的QSVM方法,利用量子计算的优势,提升模型对少数类的识别能力。
- 实验表明,QSVM在胸部X光片分类任务中,显著优于线性SVM和RBF SVM,尤其在少数类F1分数上。
📝 摘要(中文)
本文在MIMIC-CXR胸部X光片二元保险分类任务中,验证了量子核在无噪声模拟下的优势。研究使用量子支持向量机(QSVM),并结合三种医学基础模型(MedSigLIP-448、RAD-DINO、ViT-patch32)的冻结嵌入。论文提出了一个两层公平比较框架,其中两个分类器都接收相同的PCA-q特征。在第一层(未调优的QSVM vs. 未调优的线性SVM,C=1),QSVM在所有18个测试配置中都赢得了少数类F1分数(17个p<0.001,1个p<0.01)。经典线性核在每个量子比特数下,90-100%的种子都崩溃为多数类预测,而QSVM保持了非平凡的召回率。在q=11(MedSigLIP-448平台中心),QSVM实现了平均F1=0.343,而经典F1=0.050(F1增益=+0.293,p<0.001),且无需超参数调整。在第二层(未调优的QSVM vs. C调优的RBF SVM),QSVM赢得了所有七个测试配置(平均增益+0.068,最大+0.112)。特征谱分析表明,量子核有效秩在q=11时达到69.80,远超线性核秩,而经典崩溃保持C不变。完整的量子比特扫描揭示了跨模型的架构依赖性集中开始。
🔬 方法详解
问题定义:论文旨在解决医学图像分类中,经典线性核方法易于崩溃到多数类预测的问题,尤其是在处理类别不平衡的数据集时,导致少数类别的识别率极低。现有方法难以有效利用医学图像的复杂特征,限制了分类性能的提升。
核心思路:论文的核心思路是利用量子计算的优势,通过量子核方法,将医学图像的嵌入特征映射到高维量子特征空间,从而提高分类器的判别能力。量子核能够捕捉经典核难以捕捉的复杂数据关系,有效解决类别不平衡问题。
技术框架:整体框架包括以下几个阶段:1) 使用医学基础模型(如MedSigLIP-448、RAD-DINO、ViT-patch32)提取胸部X光片的嵌入特征;2) 对提取的特征进行PCA降维,得到PCA-q特征;3) 使用量子支持向量机(QSVM)进行分类,其中量子核用于计算样本之间的相似度;4) 将QSVM的性能与经典线性SVM和RBF SVM进行比较。
关键创新:最重要的技术创新点在于将量子核方法应用于医学图像分类,并证明了其在处理类别不平衡数据时的优势。与经典核方法相比,量子核能够在高维量子特征空间中更好地分离不同类别的数据,从而提高分类性能。此外,论文还提出了一个两层公平比较框架,确保了QSVM与经典方法的可比性。
关键设计:论文的关键设计包括:1) 使用PCA-q特征作为QSVM的输入,以降低计算复杂度;2) 使用未调优的QSVM与未调优的线性SVM进行比较,以评估量子核的固有优势;3) 使用C调优的RBF SVM作为更强的经典基线,进一步验证QSVM的性能;4) 通过特征谱分析,揭示量子核的有效秩远超线性核,解释了其性能优势。
🖼️ 关键图片
📊 实验亮点
实验结果表明,在MIMIC-CXR数据集上,QSVM在少数类F1分数上显著优于经典线性SVM和RBF SVM。在q=11时,QSVM实现了平均F1=0.343,而经典线性SVM的F1仅为0.050,F1增益高达+0.293(p<0.001)。即使与C调优的RBF SVM相比,QSVM仍然取得了显著的性能提升(平均增益+0.068,最大+0.112)。
🎯 应用场景
该研究成果可应用于医疗诊断辅助系统,提升疾病早期筛查的准确性,尤其是在罕见病或少数病例的识别上。通过量子核方法,可以更有效地利用医学影像数据,为临床决策提供更可靠的依据,具有重要的临床应用价值和潜力。
📄 摘要(原文)
We provide evidence of quantum kernel advantage under noiseless simulation in binary insurance classification on MIMIC-CXR chest radiographs using quantum support vector machines (QSVM) with frozen embeddings from three medical foundation models (MedSigLIP-448, RAD-DINO, ViT-patch32). We propose a two-tier fair comparison framework in which both classifiers receive identical PCA-q features. At Tier 1 (untuned QSVM vs. untuned linear SVM, C = 1 both sides), QSVM wins minority-class F1 in all 18 tested configurations (17 at p < 0.001, 1 at p < 0.01). The classical linear kernel collapses to majority-class prediction on 90-100% of seeds at every qubit count, while QSVM maintains non-trivial recall. At q = 11 (MedSigLIP-448 plateau center), QSVM achieves mean F1 = 0.343 vs. classical F1 = 0.050 (F1 gain = +0.293, p < 0.001) without hyperparameter tuning. Under Tier 2 (untuned QSVM vs. C-tuned RBF SVM), QSVM wins all seven tested configurations (mean gain +0.068, max +0.112). Eigenspectrum analysis reveals quantum kernel effective rank reaches 69.80 at q = 11, far exceeding linear kernel rank, while classical collapse remains C-invariant. A full qubit sweep reveals architecture-dependent concentration onset across models. Code: https://github.com/sebasmos/qml-medimage