IMPA-Net: Meteorology-Aware Multi-Scale Attention and Dynamic Loss for Extreme Convective Radar Nowcasting
作者: Haofei Cui, Guangxin He, Juanzhen Sun, Jingjia Luo, Haonan Chen, Xiaoran Zhuang, Mingxuan Chen, Xian Xiao
分类: cs.LG
发布日期: 2026-04-27
💡 一句话要点
IMPA-Net:气象感知多尺度注意力与动态损失用于极端对流雷达临近预报
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 雷达临近预报 极端天气 深度学习 多尺度注意力 动态损失
📋 核心要点
- 现有临近预报模型易产生过度平滑的预测,无法有效检测极端天气事件,且多尺度特征交互不足。
- IMPA-Net通过气象信息设计,在输入端引入空间混合器,架构上使用多尺度预测注意力模块,损失函数上使用动态损失。
- 实验表明,IMPA-Net在极端对流雷达临近预报任务上显著优于现有方法,尤其在强回波区域的预测能力上。
📝 摘要(中文)
基于天气雷达观测的对流降水短时临近预报对于极端天气预警至关重要。然而,使用像素级误差指标训练的深度学习模型容易产生过度平滑的预测,抑制了对灾害检测至关重要的强回波。多尺度特征交互不足和异构地球物理输入的次优融合加剧了这个问题。我们提出了IMPA-Net(集成多尺度预测注意力网络),一个确定性的0-2小时临近预报框架,通过在输入、架构和损失函数层面的气象信息设计来解决这些限制。一个无参数的空间混合器通过确定性的通道置换在mesoscale-γ邻域(约2公里)重组异构输入通道,提供一个结构化的跨场先验。一个集成的多尺度预测注意力模块作为时空转换器,捕获从mesoscale-β到mesoscale-γ尺度的动态。一个气象感知的动态损失采用三级非对称加权——跨训练周期、风暴强度和预测提前期进行调整——以抵消回归到均值。在华东地区的多源雷达数据集上,针对七个基线进行评估,在匹配设置下,IMPA-Net将≥45 dBZ的Heidke Skill Score从0.049(SimVP基线)提高到0.143。相对于pySTEPS,它在严重事件检测和误报控制之间提供了更好的权衡。频谱分析证实了在竞争方法显示逐渐平滑的mesoscale波段中保留的能量。这些改进是在单个领域和对流状态下展示的;对其他地形和气候区域的泛化性仍有待测试。
🔬 方法详解
问题定义:论文旨在解决极端对流天气雷达临近预报中,现有深度学习模型预测结果过度平滑,难以准确捕捉强回波区域,导致对极端天气事件预警能力不足的问题。现有方法在多尺度特征交互和异构数据融合方面存在缺陷,并且损失函数的设计未能充分考虑气象因素的影响。
核心思路:论文的核心思路是通过引入气象信息指导模型设计,从输入、架构和损失函数三个层面进行改进。具体来说,利用空间混合器引入跨场先验知识,使用多尺度预测注意力模块捕获不同尺度的时空动态,并设计气象感知的动态损失函数来抑制预测结果的平滑效应。
技术框架:IMPA-Net的整体架构包含以下几个主要模块:1) 输入层:使用空间混合器(Spatial Mixer)对异构输入通道进行重组,引入跨场先验知识。2) 时空转换器:集成的多尺度预测注意力模块,用于捕获mesoscale-β到mesoscale-γ尺度的时空动态。3) 预测层:根据时空转换器的输出进行未来雷达回波的预测。4) 损失函数:气象感知的动态损失函数,用于优化模型参数。
关键创新:IMPA-Net的关键创新在于:1) 气象信息指导的设计:从输入、架构和损失函数三个层面都融入了气象信息,使得模型更加符合气象学的原理。2) 空间混合器:通过确定性的通道置换,在输入端引入跨场先验知识,提高了模型对异构数据的处理能力。3) 气象感知的动态损失函数:根据训练周期、风暴强度和预测提前期动态调整损失权重,有效抑制了预测结果的平滑效应。
关键设计:1) 空间混合器:采用无参数的通道置换策略,避免了引入额外的可学习参数。2) 多尺度预测注意力模块:集成了不同尺度的注意力机制,能够捕获不同尺度的时空动态。3) 气象感知的动态损失函数:损失函数包含三级非对称加权,分别是训练周期、风暴强度和预测提前期。具体权重的计算方式未知。
📊 实验亮点
实验结果表明,IMPA-Net在华东地区的多源雷达数据集上显著优于现有方法。在≥45 dBZ的强回波区域,IMPA-Net将Heidke Skill Score从SimVP基线的0.049提高到0.143。相对于pySTEPS,IMPA-Net在严重事件检测和误报控制之间取得了更好的平衡。频谱分析也证实了IMPA-Net在mesoscale波段中保留了更多的能量,有效抑制了预测结果的平滑效应。
🎯 应用场景
IMPA-Net可应用于极端天气预警,为防灾减灾提供更准确的雷达临近预报信息。该研究成果有助于提高对强对流天气系统的监测和预测能力,减少因极端天气造成的生命财产损失。未来可进一步推广到其他地形和气候区域,提升全球范围内的临近预报水平。
📄 摘要(原文)
Short-range prediction of convective precipitation from weather radar observations is essential for severe weather warnings. However, deep learning models trained with pixel-wise error metrics tend to produce overly smooth forecasts that suppress intense echoes critical for hazard detection. This issue is exacerbated by insufficient multi-scale feature interaction and suboptimal fusion of heterogeneous geophysical inputs. We propose IMPA-Net (Integrated Multi-scale Predictive Attention Network), a deterministic 0-2 hour nowcasting framework that addresses these limitations through meteorologically-informed designs at the input, architecture, and loss function levels. A parameter-free Spatial Mixer reorganizes heterogeneous input channels at the mesoscale-$γ$ neighborhood (~2 km) via deterministic channel permutation, providing a structured cross-field prior. An integrated multi-scale predictive attention module serves as the spatiotemporal translator, capturing dynamics from mesoscale-$β$ to mesoscale-$γ$ scales. A Meteorologically-Aware Dynamic Loss employs three-level asymmetric weighting -- adapting across training epochs, storm intensity, and forecast lead time -- to counteract regression-to-the-mean. Evaluated against seven baselines on a multi-source radar dataset over eastern China, IMPA-Net raises the Heidke Skill Score at $\geq$45 dBZ from 0.049 (SimVP baseline) to 0.143 under matched settings. Relative to pySTEPS, it provides a better trade-off between severe-event detection and false-alarm control. Spectral analysis confirms preserved energy across mesoscale bands where competing methods show progressive smoothing. These improvements are shown within a single domain and convective regime; generalizability to other orographic and climatic regions remains to be tested.