Global River Forecasting with a Topology-Informed AI Foundation Model
作者: Hancheng Ren, Gang Zhao, Shuo Wang, Louise Slater, Dai Yamazaki, Shu Liu, Jingfang Fan, Shibo Cui, Ziming Yu, Shengyu Kang, Depeng Zuo, Dingzhi Peng, Zongxue Xu, Bo Pang
分类: cs.LG
发布日期: 2026-02-28
💡 一句话要点
提出GraphRiverCast,利用拓扑信息AI基础模型实现全局河流预测
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 河流预测 AI基础模型 拓扑编码 水文模拟 神经算子
📋 核心要点
- 现有河流预测方法依赖大量历史数据,且难以进行系统性模拟,尤其是在水文数据稀缺的地区。
- GRC通过拓扑编码和物理对齐的神经算子架构,实现了无需历史数据即可进行全局河流预测的“冷启动”模式。
- 实验表明,GRC在全局河流预测中表现出色,且优于物理模型和局部训练的AI模型,尤其在数据稀缺区域。
📝 摘要(中文)
本文提出了一种拓扑信息AI基础模型GraphRiverCast (GRC),用于模拟全球河流系统中多变量河流流体动力学。GRC能够在“冷启动”模式下运行,无需历史河流状态初始化即可生成预测。在7天全球伪历史预测中,GRC-ColdStart作为一个独立的模拟器,实现了约0.82的Nash-Sutcliffe效率(NSE),且没有表现出自回归范式中常见的显著误差累积。消融研究表明,在缺乏历史状态的情况下,拓扑编码作为不可或缺的结构信息,明确地指导水力连通性和网络规模的质量再分配,从而重建流动动力学。此外,通过预训练和微调策略进行局部调整时,GRC始终优于基于物理的和局部训练的AI基线。重要的是,这种优越性从已测量的河段扩展到整个河流网络,突出了拓扑编码和基于物理的预训练的必要性。GRC建立在物理对齐的神经算子架构上,实现了快速和跨尺度的自适应模拟,建立了一个连接全球流体动力学知识与局部水文现实的协作范式。
🔬 方法详解
问题定义:现有河流预测方法主要面临两个挑战:一是依赖大量历史观测数据,在数据稀缺区域表现不佳;二是难以进行系统性的河流网络模拟,通常只能进行孤立的预测,无法捕捉河流之间的相互影响。这些痛点限制了河流预测的准确性和适用范围。
核心思路:GRC的核心思路是利用河流网络的拓扑结构作为先验知识,结合物理信息进行预训练,从而在缺乏历史数据的情况下也能进行准确的河流预测。通过拓扑编码,模型能够学习河流之间的连通性,从而实现网络尺度的质量再分配和流动动力学重建。
技术框架:GRC的整体架构包含以下几个主要模块:1) 拓扑编码模块,用于将河流网络的拓扑结构转化为模型可用的向量表示;2) 物理对齐的神经算子模块,用于学习河流流体动力学的物理规律;3) 预训练和微调模块,用于将全局知识迁移到局部区域,提高预测精度。整个流程包括:首先,利用全局河流数据和拓扑结构进行预训练;然后,在特定区域利用少量观测数据进行微调;最后,利用训练好的模型进行河流预测。
关键创新:GRC最重要的技术创新点在于将河流网络的拓扑结构显式地编码到模型中,并结合物理信息进行预训练。这与传统的基于数据驱动的河流预测方法有本质区别,后者通常只关注局部河流的观测数据,而忽略了河流之间的相互影响。通过拓扑编码,GRC能够更好地捕捉河流网络的整体动力学特征。
关键设计:GRC的关键设计包括:1) 使用图神经网络进行拓扑编码,将河流网络的拓扑结构转化为节点和边的向量表示;2) 使用物理对齐的神经算子,例如傅里叶神经算子(FNO),来学习河流流体动力学的物理规律;3) 设计合适的损失函数,例如基于NSE的损失函数,来衡量预测结果的准确性;4) 使用预训练和微调策略,将全局知识迁移到局部区域,提高预测精度。
🖼️ 关键图片
📊 实验亮点
GRC在7天全球伪历史预测中,无需历史河流状态初始化,实现了约0.82的Nash-Sutcliffe效率(NSE)。通过与物理模型和局部训练的AI模型对比,GRC在多个河流流域都取得了显著的性能提升,尤其是在数据稀缺的区域。消融实验表明,拓扑编码对于提高预测精度至关重要。
🎯 应用场景
GRC可应用于全球范围内的河流流量预测、洪水预警、水资源管理和生态环境保护等领域。尤其在水文数据稀缺的地区,GRC能够提供可靠的河流预测,为决策者提供重要的参考信息。未来,GRC有望与其他环境模型相结合,构建更全面的地球系统模型,为应对气候变化和水资源挑战提供更有效的解决方案。
📄 摘要(原文)
River systems operate as inherently interconnected continuous networks, meaning river hydrodynamic simulation ought to be a systemic process. However, widespread hydrology data scarcity often restricts data-driven forecasting to isolated predictions. To achieve systemic simulation and reduce reliance on river observations, we present GraphRiverCast (GRC), a topology-informed AI foundation model designed to simulate multivariate river hydrodynamics in global river systems. GRC is capable of operating in a "ColdStart" mode, generating predictions without relying on historical river states for initialization. In 7-day global pseudo-hindcasts, GRC-ColdStart functions as a robust standalone simulator, achieving a Nash-Sutcliffe Efficiency (NSE) of approximately 0.82 without exhibiting the significant error accumulation typical of autoregressive paradigms. Ablation studies reveal that topological encoding serves as indispensable structural information in the absence of historical states, explicitly guiding hydraulic connectivity and network-scale mass redistribution to reconstruct flow dynamics. Furthermore, when adapted locally via a pre-training and fine-tuning strategy, GRC consistently outperforms physics-based and locally-trained AI baselines. Crucially, this superiority extends from gauged reaches to full river networks, underscoring the necessity of topology encoding and physics-based pre-training. Built on a physics-aligned neural operator architecture, GRC enables rapid and cross-scale adaptive simulation, establishing a collaborative paradigm bridging global hydrodynamic knowledge with local hydrological reality.