SpatialEpiBench: Benchmarking Spatial Information and Epidemic Priors in Forecasting

📄 arXiv: 2605.06530v1 📥 PDF

作者: Ruiqi Lyu, Alistair Turcan, Bryan Wilder

分类: cs.AI

发布日期: 2026-05-07

🔗 代码/项目: GITHUB


💡 一句话要点

SpatialEpiBench:构建空间流行病预测基准,揭示现有方法在实际应用中的局限性

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 流行病预测 时空建模 基准测试 公共卫生 滚动评估

📋 核心要点

  1. 现有流行病预测方法在数据稀疏、噪声干扰和非平稳性方面存在挑战,难以准确预测疫情发展。
  2. SpatialEpiBench旨在提供一个标准化的时空流行病预测基准,包含真实数据集和滚动评估,更贴近实际应用场景。
  3. 实验表明,即使结合流行病先验知识,现有方法在预测性能上仍不如简单的最后值基线,暴露了现有方法的局限性。

📝 摘要(中文)

准确的流行病预测对于公共卫生响应、资源分配和疫情干预至关重要,但由于数据稀疏、噪声大且高度非平稳,预测仍然困难。由于流行病在相互作用的区域间传播,时空方法是改进预测的自然选择。尽管人们对空间信息的兴趣日益浓厚,但目前尚无标准化的基准,且当前的评估通常使用简单的时间顺序训练-测试分割,这不能反映实时预测的实践。我们通过SpatialEpiBench解决了这一差距,SpatialEpiBench是一个具有挑战性的基准,用于在实际公共卫生环境中进行时空流行病预测。SpatialEpiBench包括11个流行病数据集,具有标准化的滚动评估和特定于爆发的指标。我们评估了具有广泛使用的流行病先验的邻接信息预测模型,这些先验使通用模型适应流行病学,但发现即使在爆发期间和使用这些先验的情况下,大多数方法也逊于提前1天到1个月的简单最后值基线。我们确定了三个主要的失败模式:(1)爆发预测能力差,(2)难以处理稀疏性和噪声,以及(3)常见地理邻接对于流行病学空间信息的效用有限。我们在https://github.com/Rachel-Lyu/SpatialEpiBench发布基准数据、代码和说明,以支持开发在操作上有用的流行病预测模型。

🔬 方法详解

问题定义:现有流行病预测方法难以应对真实世界中流行病数据的复杂性,例如数据稀疏、噪声大以及时空非平稳性。传统的评估方法,如简单的时间分割,无法反映实际的实时预测场景,导致模型在实际应用中表现不佳。

核心思路:论文的核心在于构建一个更贴近实际应用场景的流行病预测基准SpatialEpiBench。通过提供标准化的数据集、滚动评估方法和特定于疫情的评估指标,SpatialEpiBench旨在促进开发更有效、更实用的流行病预测模型。该基准鼓励研究者关注空间信息和流行病先验知识在预测中的作用。

技术框架:SpatialEpiBench包含以下几个关键组成部分: 1. 数据集:包含11个真实世界的流行病数据集,涵盖不同的疾病和地理区域。 2. 评估方法:采用滚动评估策略,模拟实时预测场景,避免了传统时间分割带来的偏差。 3. 评估指标:提供特定于疫情的评估指标,更全面地评估模型的预测性能。 4. 基线模型:提供简单的最后值基线模型,作为评估的参考。

关键创新:SpatialEpiBench的主要创新在于其基准设计的现实性和全面性。它不仅提供了多样化的数据集,还采用了更贴近实际应用的评估方法,并考虑了特定于疫情的评估指标。这使得SpatialEpiBench能够更准确地评估现有方法的性能,并为未来的研究提供更可靠的参考。

关键设计:SpatialEpiBench的关键设计包括: 1. 滚动评估窗口:通过滑动时间窗口进行评估,模拟实时预测。 2. 疫情特定指标:例如,针对疫情爆发的敏感性和特异性指标。 3. 邻接信息利用:鼓励模型利用地理邻接信息,但实验表明其效果有限。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,即使结合了流行的流行病先验知识,现有方法在SpatialEpiBench上的表现仍然不如简单的最后值基线。这表明现有方法在处理真实世界流行病数据的复杂性方面存在局限性,尤其是在爆发预测、处理稀疏性和噪声以及利用地理邻接信息方面。SpatialEpiBench的发布为改进流行病预测模型提供了重要的工具和方向。

🎯 应用场景

SpatialEpiBench可用于评估和改进各种流行病预测模型,从而提高公共卫生响应的效率和准确性。该基准可以帮助研究人员开发更有效的资源分配策略,并为疫情干预提供更可靠的依据。未来,SpatialEpiBench可以扩展到其他类型的时空预测问题,例如环境监测和交通流量预测。

📄 摘要(原文)

Accurate epidemic forecasting is crucial for public health response, resource allocation, and outbreak intervention, but remains difficult with sparse, noisy, and highly non-stationary data. Because epidemics unfold across interacting regions, spatiotemporal methods are natural candidates for improving forecasts. Despite growing interest in spatial information, no standardized benchmark exists, and current evaluations often use simple chronological train-test splits that do not reflect real-time forecasting practice. We address this gap with SpatialEpiBench, a challenging benchmark for spatiotemporal epidemic forecasting in realistic public-health settings. SpatialEpiBench includes 11 epidemic datasets with standardized rolling evaluations and outbreak-specific metrics. We evaluate adjacency-informed forecasting models with widely used epidemic priors that adapt general models to epidemiology, but find that most methods underperform a simple last-value baseline from 1 day to 1 month ahead, even during outbreaks and with these priors. We identify three major failure modes: (1) poor outbreak anticipation, (2) difficulty handling sparsity and noise, and (3) limited utility of common geographic adjacency for epidemiological spatial information. We release benchmark data, code, and instructions at https://github.com/Rachel-Lyu/SpatialEpiBench to support development of operationally useful epidemic forecasting models.