Unifying Physics- and Data-Driven Modeling via Novel Causal Spatiotemporal Graph Neural Network for Interpretable Epidemic Forecasting

📄 arXiv: 2504.05140v1 📥 PDF

作者: Shuai Han, Lukas Stelz, Thomas R. Sokolowski, Kai Zhou, Horst Stöcker

分类: cs.LG, physics.soc-ph, q-bio.QM, stat.ML

发布日期: 2025-04-07

备注: 32 pages, 12 figures. Submitted to Expert Systems with Applications and currently under review. This version includes minor revisions. The work proposes a physics-informed deep learning framework integrating a novel epidemic model with causal spatiotemporal graph neural networks for interpretable forecasting


💡 一句话要点

提出CSTGNN融合物理与数据驱动模型,用于可解释的流行病预测。

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 流行病预测 时空图神经网络 物理信息融合 疾病传播建模 可解释性 动态图 SIR模型

📋 核心要点

  1. 传统区室模型难以估计时空变化的流行病学参数,深度学习模型忽略传播动态且缺乏可解释性。
  2. 提出CSTGNN,融合时空接触SIR模型与GNN,捕获流行病的时空传播,建模人口流动动态。
  3. 在省级和州级数据集上验证,有效模拟传染病时空动态,提供预测和干预工具,并提升模型可解释性。

📝 摘要(中文)

精确的流行病预测对于有效的疾病控制和预防至关重要。传统的区室模型通常难以估计随时间和空间变化的流行病学参数,而深度学习模型通常忽略疾病传播动态,并且缺乏流行病学背景下的可解释性。为了解决这些局限性,我们提出了一种新的因果时空图神经网络(CSTGNN),这是一个混合框架,它将时空接触SIR模型与图神经网络(GNN)集成,以捕获流行病的时空传播。区域间的人口流动呈现出连续且平滑的时空模式,导致相邻的图结构共享潜在的流动动态。为了对这些动态进行建模,我们采用自适应静态连接图来表示人口流动的稳定成分,并利用时间动态模型来捕获这些模式中的波动。通过将自适应静态连接图与时间动态图集成,我们构建了一个动态图,该图封装了人口流动网络的综合属性。此外,为了捕获传染病传播的时间趋势和变化,我们引入了一个时间分解模型来处理时间依赖性。然后,将该模型与动态图卷积网络集成,用于流行病预测。我们使用中国省级和德国州级的真实世界数据集验证了我们的模型。广泛的研究表明,我们的方法有效地模拟了传染病的时空动态,为预测和干预策略提供了一个有价值的工具。此外,对学习参数的分析提供了对疾病传播机制的见解,从而增强了模型的可解释性和实际适用性。

🔬 方法详解

问题定义:论文旨在解决流行病预测中传统区室模型参数估计困难以及深度学习模型缺乏可解释性的问题。现有方法无法有效捕捉疾病传播的时空动态,难以提供准确且可解释的预测结果。

核心思路:论文的核心思路是将物理模型(SIR模型)与数据驱动模型(图神经网络)相结合,利用GNN强大的时空建模能力,同时融入SIR模型的流行病学知识,从而实现更准确、更可解释的流行病预测。通过构建动态图来表示人口流动网络,并使用时间分解模型来处理时间依赖性,从而捕捉疾病传播的时空动态。

技术框架:CSTGNN框架主要包含以下几个模块:1) 时空接触SIR模型:作为物理模型,提供疾病传播的基本动力学。2) 自适应静态连接图:表示人口流动的稳定成分。3) 时间动态模型:捕捉人口流动模式中的波动。4) 动态图构建:将自适应静态连接图与时间动态图集成,形成动态图,表示完整的人口流动网络。5) 时间分解模型:处理时间依赖性,捕捉疾病传播的时间趋势和变化。6) 动态图卷积网络:基于动态图和时间分解模型进行流行病预测。

关键创新:该论文的关键创新在于将物理模型(SIR)与数据驱动模型(GNN)进行深度融合,构建了一个混合模型CSTGNN。通过自适应静态连接图和时间动态模型构建动态图,有效捕捉了人口流动的时空动态。此外,时间分解模型的引入增强了模型对时间依赖性的处理能力。与传统方法相比,CSTGNN在预测精度和可解释性方面都有显著提升。

关键设计:论文中,自适应静态连接图和时间动态模型的具体实现方式未知。时间分解模型的设计细节未知。损失函数的设计也未明确说明。动态图卷积网络的具体结构(例如,GCN的层数、每层的节点特征维度)也未给出详细信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该论文在省级和州级真实数据集上验证了CSTGNN模型的有效性,但没有给出具体的性能指标和提升幅度。实验结果表明,CSTGNN能够有效地模拟传染病的时空动态,并提供可解释的预测结果。与现有基线方法相比,CSTGNN在预测精度和可解释性方面有所提升,但具体数值未知。

🎯 应用场景

该研究成果可应用于传染病爆发的早期预警、传播趋势预测和干预策略制定。通过分析模型学习到的参数,可以深入了解疾病传播机制,为公共卫生决策提供科学依据。该模型还可扩展到其他类型的时空预测问题,例如交通流量预测和环境污染扩散模拟。

📄 摘要(原文)

Accurate epidemic forecasting is crucial for effective disease control and prevention. Traditional compartmental models often struggle to estimate temporally and spatially varying epidemiological parameters, while deep learning models typically overlook disease transmission dynamics and lack interpretability in the epidemiological context. To address these limitations, we propose a novel Causal Spatiotemporal Graph Neural Network (CSTGNN), a hybrid framework that integrates a Spatio-Contact SIR model with Graph Neural Networks (GNNs) to capture the spatiotemporal propagation of epidemics. Inter-regional human mobility exhibits continuous and smooth spatiotemporal patterns, leading to adjacent graph structures that share underlying mobility dynamics. To model these dynamics, we employ an adaptive static connectivity graph to represent the stable components of human mobility and utilize a temporal dynamics model to capture fluctuations within these patterns. By integrating the adaptive static connectivity graph with the temporal dynamics graph, we construct a dynamic graph that encapsulates the comprehensive properties of human mobility networks. Additionally, to capture temporal trends and variations in infectious disease spread, we introduce a temporal decomposition model to handle temporal dependence. This model is then integrated with a dynamic graph convolutional network for epidemic forecasting. We validate our model using real-world datasets at the provincial level in China and the state level in Germany. Extensive studies demonstrate that our method effectively models the spatiotemporal dynamics of infectious diseases, providing a valuable tool for forecasting and intervention strategies. Furthermore, analysis of the learned parameters offers insights into disease transmission mechanisms, enhancing the interpretability and practical applicability of our model.