Data-Driven Forecasting of High-Dimensional Transient and Stationary Processes via Space-Time Projection

📄 arXiv: 2503.23686v1 📥 PDF

作者: Oliver T. Schmidt

分类: cs.LG, astro-ph.GA, nlin.CD, physics.comp-ph, physics.data-an, physics.flu-dyn

发布日期: 2025-03-31


💡 一句话要点

提出时空投影(STP)方法,用于高维瞬态和稳态过程的数据驱动预测。

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 时空预测 数据驱动 本征正交分解 高维数据 瞬态过程

📋 核心要点

  1. 现有方法难以有效预测高维时变过程,尤其是在数据驱动的背景下,缺乏对时空相关性的充分利用。
  2. 论文提出时空投影(STP)方法,通过计算时空本征正交模态,并利用其正交性和与预测区间的相关性进行预测。
  3. 实验表明,STP方法在超新星爆炸模拟和湍流工程流的预测中,优于标准LSTM神经网络,且无需额外的超参数调整。

📝 摘要(中文)

本文提出了一种名为时空投影(STP)的数据驱动预测方法,用于处理高维和时间分辨数据。该方法从训练数据中计算扩展的时空本征正交模态,训练数据跨越包含后报和预报区间在内的预测范围。然后,通过将这些模态的后报部分投影到新数据上,同时利用它们的正交性和与预报扩展的最佳相关性来生成预测。该方法基于本征正交分解(POD)理论,降维和时间延迟嵌入是其内在组成部分。对于给定的集合和固定的预测范围,唯一可调参数是截断秩——不需要额外的超参数。后报精度可以作为短期预报精度的可靠指标,并建立预报误差的下限。通过两个数据集验证了该方法的有效性:湍流星际介质中超新星爆炸的瞬态、高度各向异性模拟,以及湍流高亚音速工程流的实验速度场。在与标准长短期记忆(LSTM)神经网络的比较研究中,该方法始终提供更准确的预测。考虑到其简单性和稳健的性能,STP为预测高维瞬态和混沌过程提供了一个可解释且具有竞争力的基准,完全依赖于时空相关信息。

🔬 方法详解

问题定义:论文旨在解决高维瞬态和稳态过程的精确预测问题。现有方法,特别是深度学习方法,通常需要大量的超参数调整和训练数据,且缺乏对时空相关性的有效利用,导致预测精度受限。

核心思路:核心思路是利用本征正交分解(POD)提取数据中的主要时空模态,并利用这些模态在时间和空间上的相关性进行预测。通过将历史数据投影到这些模态上,可以有效地提取出数据的主要特征,并利用这些特征进行未来状态的预测。

技术框架:STP方法主要包含以下几个阶段:1) 数据准备:收集包含后报和预报区间的时间序列数据。2) 时空模态计算:利用POD方法计算训练数据的时空本征正交模态。3) 投影:将新的后报数据投影到计算得到的时空模态上。4) 预测:利用投影系数和时空模态的预报部分,重构出未来的状态。

关键创新:STP方法的关键创新在于其直接利用时空相关性进行预测,避免了复杂的神经网络结构和大量的超参数调整。此外,该方法将降维和时间延迟嵌入自然地融入到框架中,简化了预测流程。

关键设计:STP方法的关键设计在于截断秩的选择,即保留多少个本征正交模态。作者指出,后报精度可以作为短期预报精度的可靠指标,因此可以通过后报精度来选择合适的截断秩。此外,该方法不需要额外的损失函数或网络结构设计,简化了实现过程。

📊 实验亮点

实验结果表明,STP方法在超新星爆炸模拟和湍流工程流的预测中,均优于标准LSTM神经网络。尤其是在湍流工程流的预测中,STP方法能够更准确地捕捉到流动中的复杂结构和演化过程。此外,STP方法无需额外的超参数调整,降低了使用门槛。

🎯 应用场景

该研究成果可应用于多个领域,例如:气候预测、流体动力学、金融市场分析、以及其他涉及高维时变数据的复杂系统建模与预测。STP方法提供了一种简单且有效的预测框架,有助于理解和预测复杂系统的演化行为,为相关领域的决策提供支持。

📄 摘要(原文)

Space-Time Projection (STP) is introduced as a data-driven forecasting approach for high-dimensional and time-resolved data. The method computes extended space-time proper orthogonal modes from training data spanning a prediction horizon comprising both hindcast and forecast intervals. Forecasts are then generated by projecting the hindcast portion of these modes onto new data, simultaneously leveraging their orthogonality and optimal correlation with the forecast extension. Rooted in Proper Orthogonal Decomposition (POD) theory, dimensionality reduction and time-delay embedding are intrinsic to the approach. For a given ensemble and fixed prediction horizon, the only tunable parameter is the truncation rank--no additional hyperparameters are required. The hindcast accuracy serves as a reliable indicator for short-term forecast accuracy and establishes a lower bound on forecast errors. The efficacy of the method is demonstrated using two datasets: transient, highly anisotropic simulations of supernova explosions in a turbulent interstellar medium, and experimental velocity fields of a turbulent high-subsonic engineering flow. In a comparative study with standard Long Short-Term Memory (LSTM) neural networks--acknowledging that alternative architectures or training strategies may yield different outcomes--the method consistently provided more accurate forecasts. Considering its simplicity and robust performance, STP offers an interpretable and competitive benchmark for forecasting high-dimensional transient and chaotic processes, relying purely on spatiotemporal correlation information.