Leveraging Exogenous Signals for Hydrology Time Series Forecasting

📄 arXiv: 2511.11849v2 📥 PDF

作者: Junyang He, Judy Fox, Alireza Jafari, Ying-Jung Chen, Geoffrey Fox

分类: cs.LG

发布日期: 2025-11-14 (更新: 2025-11-26)


💡 一句话要点

利用外生信号改进水文时间序列预测,优于现有基础模型

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 水文时间序列预测 外生信号 领域知识 降雨-径流模型 CAMELS-US数据集

📋 核心要点

  1. 现有时间序列基础模型在水文等物理科学领域的应用效果评估不足,缺乏领域知识的有效融合。
  2. 该研究通过整合领域知识,特别是自然年度周期性时间序列,来提升水文降雨-径流模型的预测性能。
  3. 实验结果表明,结合全面外生输入的模型,特别是包含年度周期性信息的模型,显著优于现有基础模型。

📝 摘要(中文)

近年来,时间序列研究的进展促进了基础模型的发展。虽然涌现了许多先进的时间序列基础模型,但鲜有研究考察它们在物理科学特定下游应用中的有效性。本文研究了将领域知识融入水文降雨-径流模型的时间序列模型中的作用。使用CAMELS-US数据集,该数据集包含来自671个地点的降雨和径流数据,具有六个时间序列流和30个静态特征,我们比较了基线模型和基础模型。结果表明,包含全面已知外生输入的模型优于更有限的方法,包括基础模型。值得注意的是,结合自然的年度周期性时间序列贡献了最显著的改进。

🔬 方法详解

问题定义:论文旨在解决水文时间序列预测问题,具体是利用降雨数据预测径流。现有方法,包括一些先进的时间序列基础模型,在处理此类问题时,未能充分利用领域知识,例如自然年度周期性变化等外生信号,导致预测精度受限。

核心思路:论文的核心思路是,通过将领域知识以显式外生信号的形式融入时间序列模型,从而提高模型的预测能力。特别强调了自然年度周期性时间序列的重要性,认为它是影响径流的关键因素。

技术框架:研究使用了CAMELS-US数据集,该数据集包含671个地点的降雨和径流数据,以及六个时间序列流和30个静态特征。研究比较了基线模型和时间序列基础模型,并重点考察了在模型中加入不同类型外生信号(包括年度周期性时间序列)后,预测性能的变化。

关键创新:论文的关键创新在于强调了领域知识在水文时间序列预测中的重要性,并证明了将外生信号(特别是年度周期性时间序列)显式地融入模型可以显著提高预测精度。这与当前一些过度依赖模型复杂性而忽略领域知识的方法形成了对比。

关键设计:论文的关键设计包括:1) 选择CAMELS-US数据集进行实验,该数据集提供了丰富的水文数据和静态特征;2) 比较了多种基线模型和时间序列基础模型;3) 系统地评估了不同类型外生信号对模型性能的影响,特别是年度周期性时间序列的影响;4) 使用合适的评价指标(具体指标未知)来衡量模型的预测精度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,将全面已知的外生输入(特别是自然年度周期性时间序列)融入模型后,预测性能显著提升,优于现有基础模型。具体性能提升幅度未知,但论文强调了年度周期性时间序列对预测结果的贡献最为显著。该研究结果突出了领域知识在时间序列预测中的重要性。

🎯 应用场景

该研究成果可应用于更精确的水资源管理、洪水预警和干旱监测。通过提升水文时间序列预测的准确性,可以帮助决策者更好地应对气候变化带来的挑战,优化水资源分配,并减少自然灾害造成的损失。未来,该方法可以推广到其他具有明显周期性特征的物理科学领域。

📄 摘要(原文)

Recent advances in time series research facilitate the development of foundation models. While many state-of-the-art time series foundation models have been introduced, few studies examine their effectiveness in specific downstream applications in physical science. This work investigates the role of integrating domain knowledge into time series models for hydrological rainfall-runoff modeling. Using the CAMELS-US dataset, which includes rainfall and runoff data from 671 locations with six time series streams and 30 static features, we compare baseline and foundation models. Results demonstrate that models incorporating comprehensive known exogenous inputs outperform more limited approaches, including foundation models. Notably, incorporating natural annual periodic time series contribute the most significant improvements.