ARC-STAR: Auditable Post-Hoc Correction for PDE Foundation Models

作者: Chengze Li, Lingwei Wei, Li Sun, Hongbo Lv, Jie Yang, Hongrong Zhang, Kening Zheng, Wei-Chieh Huang, Enze Ma, Philip S. Yu

分类: cs.LG

发布日期: 2026-05-21

备注: 40 pages, including appendices

💡 一句话要点

提出ARC-STAR框架，用于偏微分方程基础模型的后验可审计校正，显著提升预测精度。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 偏微分方程 基础模型 后验校正 可审计性 风险感知 物理场预测 流体动力学

📋 核心要点

PDE基础模型预测物理场演变时存在误差累积和空间集中问题，重新训练不稳定，均匀校正效果不佳。
ARC-STAR框架通过冻结求解器、分阶段校正和风险感知路由，实现对PDE模型预测结果的精确校正。
实验表明，ARC-STAR在多个流动基准测试中显著降低了预测误差，全局和局部阶段均有显著贡献。

📝 摘要（中文）

偏微分方程(PDE)基础模型是预训练网络，用于预测速度和压力等物理场如何演变。在不熟悉的流动中，它们的预测会逐步漂移，误差集中在少数区域，而重新训练会破坏网络的稳定性，均匀的后验校正忽略了这种空间集中性。为了解决这个问题，我们提出了一个冻结求解器的后验校正框架，即自适应风险校准空间分类以进行可审计的细化(ARC-STAR)。ARC-STAR将校正组织成三个阶段：全局校正器消除广泛的求解器偏差，分块局部细化器清除全局校正后的残差，以及在部署时，无标签评分将细化路由到计算预算下的高风险块。该框架旨在（i）冻结主机，在不进行微调的情况下保留预训练的求解器；（ii）可审计，全局和局部阶段分别进行训练和评估，以获得可衡量的贡献；（iii）预算感知，使用分块接口，可以细化整个场或将有限的计算路由到高风险区域。在跨越十个状态的五个流动基准测试中，ARC-STAR是唯一一种在每个状态下将速度展开误差降低至少36倍的方法。全局阶段将原始主机误差降低91-99%，局部阶段进一步将剩余的全局后残差降低高达94.4%。

🔬 方法详解

问题定义：论文旨在解决偏微分方程(PDE)基础模型在预测物理场演变时产生的误差问题。现有方法，如重新训练，会破坏模型的稳定性，而均匀的后验校正无法有效处理误差在空间上的集中分布。因此，需要一种既能提高预测精度，又能保持模型稳定性的后验校正方法。

核心思路：ARC-STAR的核心思路是将后验校正分解为三个阶段：全局校正、局部细化和风险感知路由。全局校正消除整体偏差，局部细化处理残余误差，风险感知路由则根据计算预算将计算资源分配到高风险区域。这种分阶段、自适应的方法能够更有效地校正预测误差，同时避免了对原始模型的直接修改。

技术框架：ARC-STAR框架包含三个主要阶段： 1. 全局校正器：用于消除PDE基础模型预测中的整体偏差。 2. 局部细化器：对全局校正后的残差进行局部精细化处理，进一步降低误差。 3. 风险感知路由：在部署阶段，根据计算预算，将计算资源分配到预测风险较高的区域，实现高效的校正。

关键创新：ARC-STAR的关键创新在于其可审计性和预算感知性。可审计性体现在全局和局部阶段的训练和评估是独立的，可以清晰地衡量每个阶段的贡献。预算感知性则体现在风险感知路由机制，能够根据计算资源限制，将校正重点放在最需要关注的区域。此外，冻结求解器的设计保证了原始模型的稳定性。

关键设计：ARC-STAR采用分块处理的方式，将物理场划分为多个块，以便进行局部细化和风险评估。风险评分机制用于评估每个块的预测风险，并根据计算预算确定需要细化的块。损失函数的设计旨在最小化全局和局部阶段的预测误差，同时考虑计算效率。

🖼️ 关键图片

📊 实验亮点

实验结果表明，ARC-STAR在五个流动基准测试中，将速度展开误差降低了至少36倍。全局校正阶段将原始主机误差降低了91-99%，局部细化阶段进一步将剩余的全局后残差降低了高达94.4%。这些结果证明了ARC-STAR框架在提高PDE基础模型预测精度方面的显著优势。

🎯 应用场景

ARC-STAR框架可应用于各种涉及物理场预测的领域，如流体动力学、气候建模、材料科学等。通过提高PDE基础模型的预测精度和效率，可以加速科学发现、优化工程设计，并为决策提供更可靠的依据。该框架的可审计性和预算感知性使其在资源受限或需要高度可信度的场景中具有重要价值。

📄 摘要（原文）

Partial differential equation (PDE) foundation models are pretrained networks that forecast how physical fields like velocity and pressure evolve from a single reusable solver. On unfamiliar flows their predictions drift step by step, errors concentrate in a few regions, yet retraining destabilizes the network and uniform post-hoc correction overlooks this spatial concentration. To address this, we propose a frozen-solver post-hoc correction framework, Adaptive Risk-Calibrated Spatial Triage for Auditable Refinement (ARC-STAR). ARC-STAR organizes correction into three stages: a global corrector removes broad solver bias, a blockwise local refiner cleans the post-global residual, and, at deployment, a label-free score routes refinement to high-risk blocks under a compute budget. The framework is designed to be (i) frozen-host, preserving the pretrained solver without fine-tuning; (ii) auditable, with global and local stages trained and evaluated separately for measurable contributions; and (iii) budget-aware, using a blockwise interface that either refines the full field or routes limited compute to high-risk regions. Across five flow benchmarks spanning ten regime cells, ARC-STAR is the only method that cuts velocity rollout error by at least 36x over raw Poseidon on every cell. The global stage reduces raw host error by 91-99%, and the local stage further reduces the remaining post-global residual by up to 94.4%. Our code implementation is available at https://anonymous.4open.science/r/arc_star.

ARC-STAR: Auditable Post-Hoc Correction for PDE Foundation Models

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理