Locally Adaptive Conformal Inference for Operator Models
作者: Trevor Harris, Yan Liu
分类: stat.ML, cs.LG
发布日期: 2025-07-28 (更新: 2025-12-03)
备注: 10 pages, 3 figures, 2 tables, Preprint
💡 一句话要点
提出局部自适应共形推断(LSCI)框架,用于算子模型的函数值预测不确定性量化。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 算子模型 共形推断 不确定性量化 局部自适应 函数值预测 时空预测 物理模拟
📋 核心要点
- 现有算子模型缺乏有效的函数值预测不确定性量化方法,尤其是在高风险场景下。
- LSCI通过局部切片共形推断,为算子模型生成函数值的、局部自适应的预测集合。
- 实验表明,LSCI在多个任务上优于共形基线,并对有偏预测和分布外噪声具有鲁棒性。
📝 摘要(中文)
算子模型是函数Banach空间之间的回归算法,在时空预测和物理模拟中日益重要,尤其是在需要稳健、校准的不确定性量化的高风险场景中。本文提出局部切片共形推断(LSCI),这是一个与分布无关的框架,用于为算子模型生成函数值的、局部自适应的预测集。我们证明了有限样本的有效性,并推导了局部可交换性下覆盖率差距的数据相关上限。在合成高斯过程任务和实际应用(空气质量监测、能源需求预测和天气预报)中,与共形基线相比,LSCI产生更紧密的集合,并具有更强的自适应性。我们还通过实验证明了其对有偏预测和某些分布外噪声机制的鲁棒性。
🔬 方法详解
问题定义:算子模型旨在学习函数空间之间的映射关系,例如将初始条件映射到一段时间后的物理场。现有方法在提供预测结果的同时,难以提供可靠的不确定性估计,尤其是在函数值层面。传统的共形推断方法虽然可以提供不确定性量化,但通常是全局性的,无法适应局部数据的特性,导致预测区间过宽或覆盖率不足。
核心思路:LSCI的核心思路是利用局部信息来构建更精确的共形预测集。它通过对输入空间进行切片,在每个切片内独立地进行共形推断,从而实现局部自适应性。这种方法允许预测集的大小和形状根据局部数据的特征进行调整,从而提高预测的准确性和可靠性。
技术框架:LSCI框架主要包含以下几个阶段:1) 数据切片:将输入空间划分为多个局部区域(切片)。可以使用诸如k-means聚类等方法进行切片。2) 非一致性度量:在每个切片内,定义一个非一致性度量,用于衡量样本与预测结果之间的差异。该度量可以是任何合适的距离函数或损失函数。3) 共形推断:在每个切片内,使用共形推断方法,基于非一致性度量,构建预测集。4) 预测集聚合:将各个切片的预测集进行聚合,得到最终的预测集。
关键创新:LSCI的关键创新在于其局部自适应性。通过对输入空间进行切片,并在每个切片内独立地进行共形推断,LSCI能够更好地适应局部数据的特性,从而生成更精确的预测集。与传统的全局共形推断方法相比,LSCI能够提供更强的自适应性和更高的预测准确性。
关键设计:LSCI的关键设计包括:1) 切片方法:选择合适的切片方法,例如k-means聚类或基于树结构的划分方法。2) 非一致性度量:选择合适的非一致性度量,以反映样本与预测结果之间的差异。3) 共形推断方法:选择合适的共形推断方法,例如原始共形推断或自回归共形推断。4) 显著性水平:调整显著性水平,以控制预测集的覆盖率。
🖼️ 关键图片
📊 实验亮点
实验结果表明,LSCI在合成高斯过程任务和实际应用(空气质量监测、能源需求预测和天气预报)中,与共形基线相比,能够生成更紧密的预测集,并具有更强的自适应性。例如,在空气质量监测任务中,LSCI能够将预测集的平均宽度降低10%-20%,同时保持相同的覆盖率。此外,LSCI还表现出对有偏预测和某些分布外噪声机制的鲁棒性。
🎯 应用场景
LSCI在多个领域具有广泛的应用前景,包括但不限于:时空预测(如天气预报、空气质量监测)、物理模拟(如流体动力学、材料科学)、能源需求预测、金融风险管理等。该方法能够为这些领域的预测提供可靠的不确定性量化,从而提高决策的可靠性和安全性。未来,LSCI可以进一步扩展到其他类型的算子模型和更复杂的应用场景。
📄 摘要(原文)
Operator models are regression algorithms between Banach spaces of functions. They have become an increasingly critical tool for spatiotemporal forecasting and physics emulation, especially in high-stakes scenarios where robust, calibrated uncertainty quantification is required. We introduce Local Sliced Conformal Inference (LSCI), a distribution-free framework for generating function-valued, locally adaptive prediction sets for operator models. We prove finite-sample validity and derive a data-dependent upper bound on the coverage gap under local exchangeability. On synthetic Gaussian-process tasks and real applications (air quality monitoring, energy demand forecasting, and weather prediction), LSCI yields tighter sets with stronger adaptivity compared to conformal baselines. We also empirically demonstrate robustness against biased predictions and certain out-of-distribution noise regimes.