MambaRain: Multi-Scale Mamba-Attention Framework for 0-3 Hour Precipitation Nowcasting
作者: Chunlei Shi, Cui Wu, Xiang Xu, Hao Li, Ni Fan, Xue Han, Yongchao Feng, Yufeng Zhu, Boyu Liu, Zengliang Zang, Hongbin Wang, Yanlan Yang, Dan Niu
分类: cs.CV
发布日期: 2026-05-14
备注: 9 pages,7 figures
💡 一句话要点
MambaRain:结合Mamba和注意力机制的多尺度降水临近预报框架
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)
关键词: 降水临近预报 Mamba 自注意力机制 时空建模 多尺度架构
📋 核心要点
- 现有确定性降水临近预报方法在超过90分钟的预测时效后性能显著下降,难以捕捉长程时空依赖。
- MambaRain结合Mamba和自注意力机制,利用Mamba建模长程时间依赖,自注意力捕捉空间相关性,实现更全面的时空表征。
- 实验结果表明,MambaRain在0-3小时临近预报任务中优于现有方法,尤其在2-3小时预测范围内提升显著。
📝 摘要(中文)
本文提出MambaRain,一种用于0-3小时降水临近预报的新型多尺度编码器-解码器架构。该架构协同整合了Mamba的线性复杂度长程时间建模能力与自注意力机制对显式空间相关性的捕捉能力。核心创新在于混合设计范式,其中Mamba块利用选择性状态空间机制以高效的计算方式对扩展序列的全局时间动态进行建模,而自注意力模块则显式地表征降水场内的空间相关性。这种互补协同作用实现了全面的时空表征学习,有效地将可行的预测范围扩展到2-3小时,并显著提高了准确性。此外,本文还引入了一种谱损失公式,以减轻混沌降水系统特有的模糊伪影,从而保留了对临近预报准确性至关重要的精细运动细节。实验验证表明,MambaRain在0-3小时临近预报任务中显著优于现有的确定性方法,尤其是在具有挑战性的2-3小时预测范围内,性能提升更为显著。
🔬 方法详解
问题定义:论文旨在解决0-3小时降水临近预报问题,现有确定性方法难以有效捕捉雷达观测数据中的长程时空依赖关系,导致预测时效超过90分钟后性能急剧下降。现有方法无法兼顾计算效率和对复杂时空关系的建模能力,尤其是在较长时间范围内的预测中,精度难以保证。
核心思路:论文的核心思路是结合Mamba和自注意力机制的优势,利用Mamba的高效长程时间建模能力和自注意力机制的空间相关性捕捉能力,构建一个多尺度的编码器-解码器框架。通过这种混合架构,可以更全面地学习降水数据的时空表征,从而提高临近预报的准确性和预测时效。
技术框架:MambaRain采用编码器-解码器架构。编码器部分使用多层Mamba块和自注意力模块提取时空特征。Mamba块负责捕捉时间依赖,自注意力模块负责捕捉空间相关性。解码器部分则利用提取的特征进行降水预测。此外,还引入了谱损失函数来减少预测结果中的模糊伪影。整体流程为:输入雷达观测数据,经过编码器提取时空特征,然后通过解码器生成未来降水预测结果,最后使用谱损失函数进行优化。
关键创新:MambaRain的关键创新在于混合使用了Mamba和自注意力机制。Mamba擅长长程时间序列建模,但缺乏显式的空间建模能力;自注意力机制擅长捕捉空间相关性,但计算复杂度较高。MambaRain将两者结合,既能高效地处理长序列,又能有效地捕捉空间信息,从而实现更准确的降水临近预报。这是与现有方法最本质的区别。
关键设计:MambaRain的关键设计包括:1) 多尺度编码器-解码器架构,允许在不同尺度上提取时空特征;2) Mamba块和自注意力模块的混合使用,平衡了计算效率和建模能力;3) 谱损失函数,用于减少预测结果中的模糊伪影,保留精细的运动细节。具体参数设置和网络结构细节未在摘要中详细说明,属于未知信息。
🖼️ 关键图片
📊 实验亮点
MambaRain在0-3小时降水临近预报任务中显著优于现有确定性方法,尤其是在2-3小时预测范围内性能提升更为显著。摘要中未提供具体的性能数据和对比基线,属于未知信息。但强调了在更长时间范围内的预测能力提升,表明MambaRain在解决长程时空依赖问题上取得了显著进展。
🎯 应用场景
MambaRain可应用于气象预报、灾害预警、农业生产、城市排水系统管理等领域。准确的降水临近预报能够帮助政府和相关部门提前做好防灾减灾准备,减少自然灾害带来的损失。在农业方面,可以指导农民合理安排灌溉和施肥,提高农作物产量。在城市管理方面,可以帮助优化排水系统,减少城市内涝的发生。未来,该研究有望推动临近预报技术的进一步发展,为社会带来更大的经济和社会效益。
📄 摘要(原文)
Accurate precipitation nowcasting over extended horizons (0-3 hours) is essential for disaster mitigation and operational decision-making, yet remains a critical challenge in the field. Existing deterministic approaches are predominantly constrained to shorter prediction windows (0-2 hours), exhibiting severe performance degradation beyond 90 minutes owing to their inherent difficulty in capturing long-range spatiotemporal dependencies from radar-derived observations. To address these fundamental limitations, we propose MambaRain, a novel multi-scale encoder-decoder architecture that synergistically integrates Mamba's linear-complexity long-range temporal modeling with self-attention mechanisms for explicit spatial correlation capture. The core innovation lies in a hybrid design paradigm wherein Mamba blocks leverage selective state space mechanisms to model global temporal dynamics across extended sequences with computational efficiency, while self-attention modules explicitly characterize spatial correlations within precipitation fields - a capability inherently absent in Mamba's sequential processing paradigm. This complementary synergy enables comprehensive spatiotemporal representation learning, effectively extending the viable forecasting horizon to 2-3 hours with substantial accuracy improvements. Furthermore, we introduce a spectral loss formulation to mitigate blurring artifacts characteristic of chaotic precipitation systems, thereby preserving fine-scale motion details critical for nowcasting accuracy. Experimental validation demonstrates that MambaRain substantially outperforms existing deterministic methodologies in 0-3 hour nowcasting tasks, with particularly pronounced performance gains in the challenging 2-3 hour prediction range.