A Comparison of Lightweight Deep Learning Models for Particulate-Matter Nowcasting in the Indian Subcontinent & Surrounding Regions
作者: Ansh Kushwaha, Kaushik Gopalan
分类: cs.CV
发布日期: 2025-11-14
💡 一句话要点
提出轻量级深度学习模型,用于印度次大陆及周边地区PM1、PM2.5和PM10的短时临近预报。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 空气质量预测 短时临近预报 深度学习 轻量级模型 参数特异性 印度次大陆 颗粒物 大气污染
📋 核心要点
- 现有空气质量预测模型在计算资源有限的区域部署困难,且难以针对特定污染物进行优化。
- 论文提出针对PM1、PM2.5和PM10分别设计轻量级深度学习模型,以提高预测精度和推理速度。
- 实验结果表明,所提出的轻量级模型在短时临近预报任务中,显著优于Aurora基础模型。
📝 摘要(中文)
本文针对Weather4Cast~2025补充污染任务,提出了一个高效的框架,用于对印度次大陆及周边地区的PM$1$、PM${2.5}$和PM$_{10}$进行6小时提前期的短时临近预报。该方法利用了哥白尼大气监测服务(CAMS)全球大气成分预测的分析场,分辨率为0.4度。模型输入使用256x256的空间区域(覆盖28.4S-73.6N和32E-134.0E),预测则生成于中心的128x128区域(跨越2.8S-48N和57.6E-108.4E),确保以印度为中心的预测区域具有足够的综合尺度背景。模型使用2021-2023年的CAMS分析数据进行训练,采用90/10的随机划分,并在2024年的数据上进行独立评估。开发了三个轻量级的、参数特定的架构,以提高准确性,最大限度地减少系统偏差,并实现快速推理。使用RMSE、MAE、Bias和SSIM进行的评估表明,与Aurora基础模型相比,性能有了显著提高,突显了紧凑型和专用型深度学习模型在有限空间域上进行短时预报的有效性。
🔬 方法详解
问题定义:论文旨在解决印度次大陆及周边地区细颗粒物(PM1、PM2.5、PM10)的6小时短时临近预报问题。现有方法,如Aurora基础模型,可能无法在计算资源受限的区域有效部署,并且缺乏针对特定污染物的优化。
核心思路:论文的核心思路是为每种颗粒物(PM1、PM2.5、PM10)分别设计轻量级的、参数特定的深度学习模型。这种参数特异性允许模型更有效地学习特定污染物的时空特征,从而提高预测精度和推理速度。通过专注于有限的空间区域,模型可以进一步减少计算负担。
技术框架:整体框架包括数据预处理、模型训练和模型评估三个主要阶段。数据预处理阶段涉及从CAMS全球大气成分预测中提取分析场数据,并将其裁剪到256x256的空间区域。模型训练阶段使用2021-2023年的数据,采用90/10的随机划分进行训练和验证。模型评估阶段使用2024年的数据进行独立评估,并使用RMSE、MAE、Bias和SSIM等指标来衡量模型的性能。
关键创新:论文的关键创新在于针对每种颗粒物设计了轻量级的、参数特定的深度学习模型。这种参数特异性与现有通用模型形成对比,允许模型更有效地学习特定污染物的时空特征。此外,模型的设计侧重于在有限的空间区域内实现快速推理,使其适用于计算资源受限的区域。
关键设计:论文中,模型输入为256x256的空间区域,预测区域为中心的128x128区域。训练数据使用2021-2023年的CAMS分析数据,并采用90/10的随机划分。损失函数未知,网络结构细节未知,但强调了轻量级和参数特异性。
🖼️ 关键图片
📊 实验亮点
实验结果表明,所提出的轻量级深度学习模型在PM1、PM2.5和PM10的6小时短时临近预报任务中,显著优于Aurora基础模型。具体性能提升数据未知,但摘要强调了在RMSE、MAE、Bias和SSIM等指标上的显著性能增益,突显了紧凑型和专用型深度学习模型在有限空间域上进行短时预报的有效性。
🎯 应用场景
该研究成果可应用于印度次大陆及周边地区的空气质量监测和预报系统,为政府部门和公众提供更准确的短时临近预报信息,辅助制定空气污染防治措施,并为居民提供健康防护建议。该方法也可推广到其他区域和污染物,具有广泛的应用前景。
📄 摘要(原文)
This paper is a submission for the Weather4Cast~2025 complementary Pollution Task and presents an efficient framework for 6-hour lead-time nowcasting of PM$1$, PM${2.5}$, and PM$_{10}$ across the Indian subcontinent and surrounding regions. The proposed approach leverages analysis fields from the Copernicus Atmosphere Monitoring Service (CAMS) Global Atmospheric Composition Forecasts at 0.4 degree resolution. A 256x256 spatial region, covering 28.4S-73.6N and 32E-134.0E, is used as the model input, while predictions are generated for the central 128x128 area spanning 2.8S-48N and 57.6E-108.4E, ensuring an India-centric forecast domain with sufficient synoptic-scale context. Models are trained on CAMS analyses from 2021-2023 using a shuffled 90/10 split and independently evaluated on 2024 data. Three lightweight parameter-specific architectures are developed to improve accuracy, minimize systematic bias, and enable rapid inference. Evaluation using RMSE, MAE, Bias, and SSIM demonstrates substantial performance gains over the Aurora foundation model, underscoring the effectiveness of compact & specialized deep learning models for short-range forecasts on limited spatial domains.