Structure-Adaptive Conformal Inference for Large-Scale Out-of-Distribution Testing
作者: Rongyi Sun, Wenguang Sun, Zinan Zhao
分类: stat.ME, cs.AI, cs.LG, stat.ML
发布日期: 2026-05-26
💡 一句话要点
提出结构自适应共形推断方法,用于大规模分布外测试。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 分布外检测 共形推断 结构自适应 模型选择 错误发现率控制
📋 核心要点
- 传统共形推断方法依赖联合可交换性,难以有效利用时空或分组等结构化辅助信息。
- 论文提出结构自适应共形q值(SCQ)和伪分数引导的转导式自动模型选择(P-TAMS),形成统一框架。
- 实验结果表明,该方法能有效控制错误发现率,并在多种场景下表现出良好的性能。
📝 摘要(中文)
本文针对高风险机器学习应用中的结构化分布外(OOD)测试问题。传统的共形方法依赖于联合可交换性,难以整合时空或分组结构等辅助信息。为了克服这一局限性,我们提出了一种结构自适应共形q值(SCQ),这是一种将个体测试证据与结构模式相结合的显著性指标。我们还开发了伪分数引导的转导式自动模型选择(P-TAMS),它使共形化模型选择适应于跨候选模型工具箱的结构化OOD测试。SCQ和P-TAMS共同构成了一个在成对可交换性下的统一框架,提供了有限样本误差率控制、更高的功效和增强的可解释性。在模拟和真实数据上的实验表明,该方法控制了错误发现率,并在不同的设置中表现良好。
🔬 方法详解
问题定义:论文旨在解决大规模分布外(OOD)测试中,传统共形推断方法难以有效利用数据内在结构(如时空关系、分组信息)的问题。现有方法依赖于联合可交换性假设,这在实际应用中往往难以满足,导致测试结果的准确性和可靠性下降。因此,如何将数据的结构信息融入到OOD测试过程中,是本文要解决的核心问题。
核心思路:论文的核心思路是将个体测试证据与数据的结构模式相结合,从而实现结构自适应的OOD测试。具体来说,通过设计一种新的显著性指标(SCQ),该指标能够根据数据之间的结构关系调整个体测试的显著性,从而更准确地判断样本是否为OOD样本。此外,论文还提出了一种伪分数引导的转导式自动模型选择方法(P-TAMS),用于在多个候选模型中选择最适合当前结构化数据的模型。
技术框架:该方法的技术框架主要包含两个核心模块:结构自适应共形q值(SCQ)计算和伪分数引导的转导式自动模型选择(P-TAMS)。首先,利用SCQ计算每个样本的显著性指标,该指标考虑了样本之间的结构关系。然后,利用P-TAMS在多个候选模型中选择最适合当前数据的模型。最后,基于选择的模型和SCQ值,进行OOD测试,并控制错误发现率。
关键创新:论文的关键创新在于提出了结构自适应的共形推断方法,该方法能够有效地利用数据的结构信息,从而提高OOD测试的准确性和可靠性。与传统的共形推断方法相比,该方法不再依赖于联合可交换性假设,而是基于成对可交换性假设,从而更具有普适性。此外,P-TAMS的引入使得模型选择过程更加自动化和高效。
关键设计:SCQ的设计关键在于如何有效地将结构信息融入到显著性指标的计算中。论文采用了一种基于图的结构表示方法,将数据之间的结构关系表示为一个图,然后利用图上的算法来调整个体测试的显著性。P-TAMS的关键设计在于如何利用伪分数来引导模型选择过程。论文通过计算每个模型在训练集上的伪分数,然后利用这些伪分数来选择最适合当前数据的模型。
🖼️ 关键图片
📊 实验亮点
实验结果表明,所提出的SCQ和P-TAMS方法在模拟和真实数据集上均表现出良好的性能。具体来说,该方法能够有效地控制错误发现率(FDR),并在不同的数据分布和结构下,显著优于传统的共形推断方法。在某些实验中,该方法可以将FDR降低到传统方法的50%以下,同时保持较高的测试功效。
🎯 应用场景
该研究成果可广泛应用于高风险机器学习应用中,例如医疗诊断、金融风控、自动驾驶等领域。在这些领域中,OOD测试的准确性和可靠性至关重要,因为错误的判断可能会导致严重的后果。通过利用数据的结构信息,该方法可以提高OOD测试的准确性,从而降低风险,提高系统的安全性。
📄 摘要(原文)
This paper addresses structured out-of-distribution (OOD) testing in high-stakes machine learning applications. Traditional conformal methods rely on joint exchangeability, making it difficult to incorporate auxiliary information such as spatiotemporal or grouping structures. To overcome this limitation, we propose the structure-adaptive conformal q-value (SCQ), a significance index that integrates individual test evidence with structural patterns. We also develop pseudo-score-guided transductive automated model selection (P-TAMS), which adapts conformalized model selection to structured OOD testing across a toolbox of candidate models. Together, SCQ and P-TAMS form a unified framework under pairwise exchangeability, providing finite-sample error-rate control, improved power, and enhanced interpretability. Experiments on simulated and real data demonstrate that the proposed approach controls the false discovery rate and performs well across diverse settings.