Computationally-efficient deep learning models for nowcasting of precipitation: A solution for the Weather4cast 2025 challenge
作者: Anushree Bhuskute, Kaushik Gopalan, Jeet Shah
分类: cs.CV
发布日期: 2025-11-14
💡 一句话要点
提出基于ConvGRU和迁移学习的降水临近预报模型,在Weather4cast 2025挑战赛中获得第二名。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 降水临近预报 ConvGRU 迁移学习 时空预测 气象预报
📋 核心要点
- 现有的降水临近预报方法通常需要复杂的输入数据和大量的计算资源,限制了其在资源受限环境中的应用。
- 该论文提出了一种基于ConvGRU和迁移学习的框架,利用SEVIRI红外通道数据预测亮温,再映射到降雨率,有效降低了计算复杂度。
- 该方法在Weather4Cast 2025竞赛的累积降雨任务中获得第二名,证明了其在短期降雨预测方面的有效性。
📝 摘要(中文)
本研究提出了一种基于卷积门控循环单元(ConvGRU)的迁移学习框架,用于Weather4Cast 2025竞赛中的短期降雨预测。该方法仅使用单个SEVIRI红外通道(10.8微米波长)作为输入,包含一小时内的四个观测值。采用两阶段训练策略来生成提前四小时的降雨估计。第一阶段,训练ConvGRU预测SEVIRI的亮温,使模型能够捕获相关的时空模式。第二阶段,使用经验导出的非线性变换将预测场映射到与OPERA兼容的降雨率。对于事件预测任务,使用3D事件检测处理转换后的降雨预测,然后进行时空特征提取以识别和表征降水事件。我们的提交在累积降雨任务中获得第二名。此外,相同的模型直接用于事件预测任务,并获得了与竞赛基线模型相似的分数。
🔬 方法详解
问题定义:论文旨在解决短期降雨预测问题,特别是在计算资源有限的情况下。现有方法通常依赖于复杂的数值天气预报模型或需要大量计算的深度学习模型,难以满足实时性和资源约束的需求。
核心思路:论文的核心思路是利用迁移学习,将降雨预测任务分解为两个阶段:首先预测亮温,然后将亮温映射到降雨率。这种分解降低了模型的复杂度,并允许模型学习更通用的时空特征。使用ConvGRU来捕捉亮温的时空动态变化。
技术框架:整体框架包含两个主要阶段:1) 亮温预测阶段:使用ConvGRU模型,以SEVIRI红外通道数据作为输入,预测未来一段时间的亮温。2) 降雨率转换阶段:使用经验导出的非线性变换,将预测的亮温场映射到与OPERA兼容的降雨率。对于事件预测,则在降雨率转换后,进行3D事件检测和时空特征提取。
关键创新:该方法的主要创新点在于使用迁移学习的思想,将复杂的降雨预测问题分解为亮温预测和降雨率转换两个相对简单的子问题。此外,使用ConvGRU有效地捕捉了亮温的时空动态变化,并利用经验公式进行亮温到降雨率的转换,降低了计算复杂度。
关键设计:模型使用单个SEVIRI红外通道(10.8 μm 波长)作为输入,包含一小时内的四个观测值。ConvGRU的具体网络结构未知,但其核心在于卷积操作与GRU的结合,用于提取时空特征。亮温到降雨率的非线性变换是经验导出的,具体公式未知。损失函数和优化器等细节也未在摘要中提及。
🖼️ 关键图片
📊 实验亮点
该模型在Weather4Cast 2025竞赛的累积降雨任务中获得了第二名,证明了其有效性。虽然摘要中没有给出具体的性能指标,但该结果表明,基于ConvGRU和迁移学习的框架能够有效地进行短期降雨预测。此外,该模型在事件预测任务中也取得了与基线模型相似的性能,说明其具有一定的泛化能力。
🎯 应用场景
该研究成果可应用于气象预报、农业生产、灾害预警等领域。特别是在资源受限的地区,该方法能够以较低的计算成本提供较为准确的短期降雨预测,有助于提高防灾减灾能力,保障人民生命财产安全。未来可进一步研究不同区域和气候条件下的适用性,并结合其他数据源提高预测精度。
📄 摘要(原文)
This study presents a transfer-learning framework based on Convolutional Gated Recurrent Units (ConvGRU) for short-term rainfall prediction in the Weather4Cast 2025 competition. A single SEVIRI infrared channel (10.8 μm wavelength) is used as input, which consists of four observations over a one-hour period. A two-stage training strategy is applied to generate rainfall estimates up to four hours ahead. In the first stage, ConvGRU is trained to forecast the brightness temperatures from SEVIRI, enabling the model to capture relevant spatiotemporal patterns. In the second stage, an empirically derived nonlinear transformation maps the predicted fields to OPERA-compatible rainfall rates. For the event-prediction task, the transformed rainfall forecasts are processed using 3D event detection followed by spatiotemporal feature extraction to identify and characterize precipitation events. Our submission achieved 2nd place in the cumulative rainfall task. Further, the same model was used out-of-the-box for the event prediction task, and resulted in similar scores as the baseline model to the competition.