MFC-RFNet: A Multi-scale Guided Rectified Flow Network for Radar Sequence Prediction
作者: Wenjie Luo, Chuanhu Deng, Chaorong Li, Rongyao Deng, Qiang Yang
分类: cs.CV, cs.AI
发布日期: 2026-01-07
💡 一句话要点
提出MFC-RFNet,融合多尺度特征与校正流,用于提升雷达回波序列预测精度。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 雷达回波预测 临近预报 多尺度特征 校正流 时空序列预测
📋 核心要点
- 现有雷达回波预测方法难以有效建模复杂的多尺度演变,且易受帧间位移影响,长程时空依赖捕获能力不足。
- MFC-RFNet通过多尺度特征通信、引导特征融合以及校正流训练,学习近线性概率流轨迹,实现高精度雷达回波预测。
- 在四个公开数据集上的实验表明,MFC-RFNet在回波形态清晰度和长期预测能力上均优于现有方法。
📝 摘要(中文)
本文提出了一种多尺度特征通信校正流网络(MFC-RFNet),用于解决雷达回波序列的精确和高分辨率降水临近预报问题。该框架集成了多尺度通信与引导特征融合,旨在应对复杂的多尺度演变建模、由位移引起的帧间特征未对齐校正以及在不牺牲空间保真度的情况下有效捕获长程时空上下文等挑战。通过波导跳跃连接(WGSC)保留高频分量,特征通信模块(FCM)促进双向跨尺度交互,条件引导空间变换融合(CGSTF)学习空间变换以对齐浅层特征。骨干网络采用校正流训练,学习近线性概率流轨迹,实现稳定保真度的少步采样。轻量级Vision-RWKV块用于捕获低空间分辨率下的长程时空依赖性。在SEVIR、MeteoNet、上海和CIKM四个公共数据集上的评估表明,该方法优于现有基线,在高降雨率阈值下产生更清晰的回波形态,并在更长的提前期内保持技能。
🔬 方法详解
问题定义:论文旨在解决雷达回波序列预测中,现有方法难以有效建模复杂的多尺度演变、校正帧间特征未对齐以及捕获长程时空上下文的问题。现有方法通常难以在高降雨率阈值下保持清晰的回波形态,且长期预测能力有限。
核心思路:论文的核心思路是将多尺度特征通信、空间变换对齐和校正流训练相结合,从而更有效地建模雷达回波的演变过程。通过多尺度特征通信增强特征表达,利用空间变换校正帧间位移,并借助校正流训练学习稳定的概率流轨迹,实现高保真度的预测。
技术框架:MFC-RFNet的整体架构包含编码器、瓶颈层和解码器三个主要部分。编码器负责提取输入雷达回波序列的多尺度特征;瓶颈层利用轻量级Vision-RWKV块捕获长程时空依赖;解码器则将提取的特征解码为预测的雷达回波序列。此外,网络还包含波导跳跃连接(WGSC)、特征通信模块(FCM)和条件引导空间变换融合(CGSTF)等关键模块。
关键创新:论文的关键创新在于将多尺度特征通信、空间变换对齐和校正流训练有机结合。WGSC保留高频信息,FCM促进跨尺度交互,CGSTF校正帧间位移,校正流训练保证生成过程的稳定性。这种协同作用使得MFC-RFNet能够更准确地预测雷达回波的演变。
关键设计:WGSC利用小波变换分解特征图,保留高频分量;FCM采用双向GRU进行跨尺度特征融合;CGSTF利用条件回波引导空间变换,实现特征对齐;校正流训练采用L1损失和感知损失的组合,以提高预测的准确性和视觉质量。Vision-RWKV块采用相对位置编码,降低计算复杂度。
📊 实验亮点
MFC-RFNet在SEVIR、MeteoNet、上海和CIKM四个公共数据集上均取得了显著的性能提升。例如,在SEVIR数据集上,MFC-RFNet在高降雨率阈值下的CSI指标优于现有基线,并且在更长的提前期内保持了较高的预测准确性。实验结果表明,该方法能够生成更清晰的回波形态,并具有更强的长期预测能力。
🎯 应用场景
该研究成果可应用于灾害预警、农业生产、交通运输等领域。精确的降水临近预报能够帮助政府和相关部门提前做好防灾减灾准备,减少自然灾害带来的损失。同时,该技术也可用于指导农业灌溉和交通调度,提高资源利用效率和保障出行安全。未来,该研究有望进一步推广到其他时空序列预测任务中。
📄 摘要(原文)
Accurate and high-resolution precipitation nowcasting from radar echo sequences is crucial for disaster mitigation and economic planning, yet it remains a significant challenge. Key difficulties include modeling complex multi-scale evolution, correcting inter-frame feature misalignment caused by displacement, and efficiently capturing long-range spatiotemporal context without sacrificing spatial fidelity. To address these issues, we present the Multi-scale Feature Communication Rectified Flow (RF) Network (MFC-RFNet), a generative framework that integrates multi-scale communication with guided feature fusion. To enhance multi-scale fusion while retaining fine detail, a Wavelet-Guided Skip Connection (WGSC) preserves high-frequency components, and a Feature Communication Module (FCM) promotes bidirectional cross-scale interaction. To correct inter-frame displacement, a Condition-Guided Spatial Transform Fusion (CGSTF) learns spatial transforms from conditioning echoes to align shallow features. The backbone adopts rectified flow training to learn near-linear probability-flow trajectories, enabling few-step sampling with stable fidelity. Additionally, lightweight Vision-RWKV (RWKV) blocks are placed at the encoder tail, the bottleneck, and the first decoder layer to capture long-range spatiotemporal dependencies at low spatial resolutions with moderate compute. Evaluations on four public datasets (SEVIR, MeteoNet, Shanghai, and CIKM) demonstrate consistent improvements over strong baselines, yielding clearer echo morphology at higher rain-rate thresholds and sustained skill at longer lead times. These results suggest that the proposed synergy of RF training with scale-aware communication, spatial alignment, and frequency-aware fusion presents an effective and robust approach for radar-based nowcasting.