Explainable Comparison of Feature-Based and Deep Learning Models for TROPOMI Methane Plume Screening

作者: Solomiia Kurchaba, Joannes D. Maasakkers, Berend J. Schuit, Ilse Aben

分类: cs.LG, physics.ao-ph

发布日期: 2026-05-26

💡 一句话要点

对比特征工程与深度学习模型，用于TROPOMI甲烷羽流识别并提供可解释性分析

🎯 匹配领域: 支柱七：动作重定向 (Motion Retargeting)

关键词: 甲烷羽流检测 卫星遥感 深度学习 特征工程 可解释性分析 TROPOMI 排放监测

📋 核心要点

现有基于专家设计的特征工程方法，在甲烷羽流识别中存在信息范围受限、破坏空间关系和信息丢失等问题。
本研究对比了基于特征工程和基于图像的深度学习模型，用于甲烷羽流-伪影分类，并利用SHAP进行可解释性分析。
实验结果为实际甲烷筛选工作流程中的模型选择提供了指导，有助于提高甲烷排放检测的准确性和效率。

📝 摘要（中文）

持续且全球性地检测大型甲烷排放是减缓全球变暖的关键步骤。卫星观测，如S5P/TROPOMI，结合羽流检测算法，可以在这项工作中发挥关键作用。然而，并非所有看起来像甲烷排放羽流的TROPOMI羽流检测结果都是实际排放造成的。数据中很大一部分羽流状特征是检索伪影，可能是由于海拔变化或反照率梯度、高浓度气溶胶、海岸线、水体等造成的。先前的工作通过支持向量机分类器(SVC)来解决羽流-伪影分类问题，该分类器在由领域专家设计的基于观测的大量标量特征上进行训练。然而，这种方法将算法接收的信息范围限制在专家认为重要的信息上，破坏了像素之间的空间关系，并在统计聚合过程中丢失信息。在本研究中，我们比较了基于特征(SVC、随机森林、XGBoost)和基于图像(ResNet-18、ResNet-34)的模型，用于平衡和不平衡评估设置下的甲烷羽流-伪影分类。为了解释结果，我们将基于SHAP的可解释性应用于这两个模型系列。我们的发现为CAMS甲烷热点探测器等操作性甲烷筛选工作流程中的模型选择提供了实践指导。

🔬 方法详解

问题定义：论文旨在解决TROPOMI卫星数据中甲烷羽流检测的准确性问题。现有方法依赖于领域专家设计的特征，然后使用支持向量机等传统机器学习方法进行分类。这种方法的痛点在于，专家设计的特征可能无法捕捉到所有重要的信息，并且会破坏像素之间的空间关系，导致信息丢失，从而影响分类精度。此外，这些方法的可解释性较差，难以理解模型的决策过程。

核心思路：论文的核心思路是比较基于特征工程的传统机器学习方法和基于图像的深度学习方法在甲烷羽流-伪影分类任务中的表现。同时，利用SHAP方法对两种模型进行可解释性分析，从而理解不同模型做出决策的关键因素。通过对比分析，为实际应用场景选择合适的模型提供指导。

技术框架：整体流程包括以下几个步骤：1) 数据预处理：对TROPOMI卫星数据进行清洗和准备，包括羽流和伪影的标注。2) 特征工程：提取领域专家设计的特征，用于训练传统机器学习模型。3) 模型训练：训练基于特征的机器学习模型（SVC、随机森林、XGBoost）和基于图像的深度学习模型（ResNet-18、ResNet-34）。4) 模型评估：在平衡和不平衡数据集上评估模型的性能。5) 可解释性分析：使用SHAP方法分析模型的决策过程，识别关键特征或像素。

关键创新：论文的关键创新在于同时比较了基于特征工程和基于图像的深度学习方法，并利用SHAP方法进行可解释性分析。这使得研究人员能够理解不同模型的优势和劣势，并为实际应用选择合适的模型。此外，论文还考虑了数据集不平衡的情况，这在实际应用中非常常见。

关键设计：论文中，基于特征的模型使用了领域专家设计的特征，例如海拔变化、反照率梯度等。深度学习模型使用了预训练的ResNet-18和ResNet-34网络，并进行了微调。为了处理数据集不平衡的问题，论文使用了不同的评估指标，例如精确率、召回率和F1分数。SHAP方法用于解释模型的决策过程，识别对分类结果影响最大的特征或像素。

🖼️ 关键图片

📊 实验亮点

研究对比了多种机器学习和深度学习模型在甲烷羽流识别任务上的性能，并利用SHAP进行可解释性分析。结果表明，深度学习模型在一定程度上优于传统机器学习模型，但不同模型在不同数据集上的表现存在差异。SHAP分析揭示了不同模型关注的关键特征，为模型选择和优化提供了依据。

🎯 应用场景

该研究成果可应用于全球甲烷排放监测和溯源，帮助识别和定位大型甲烷排放源。通过提高甲烷羽流检测的准确性，可以为政策制定者和企业提供更可靠的数据支持，从而制定更有效的减排措施。此外，该研究的可解释性分析有助于理解甲烷排放的影响因素，为进一步的研究提供思路。

📄 摘要（原文）

Continuous and global detection of large methane emissions is a crucial step for global warming mitigation. Satellite observations, such as from S5P/TROPOMI, combined with plume detection algorithms, can play a key role in this effort. However, not all TROPOMI plume detections that look like methane emission plumes are the result of actual emissions. A significant part of the plume-like features in the data are retrieval artifacts. Such artifacts could be the result of variations in elevation or albedo gradients, high concentrations of aerosols, coastal lines, water bodies, etc. Previous work approached the problem of plume-artifact classification by means of a Support Vector Machine Classifier (SVC), trained on an extensive set of observation-based scalar features designed by domain experts. However, such an approach limits the information scope received by the algorithm to what is deemed to be important by the experts, breaks the spatial relationship between pixels, and loses information during the process of statistical aggregation. In this study, we compare feature-based (SVC, Random Forest, XGBoost) and image-based (ResNet-18, ResNet-34) models for methane plume-artifact classification under balanced and imbalanced evaluation settings. To interpret the results, we apply SHAP-based explainability to both model families. Our findings provide practical guidance for model selection in operational methane-screening workflows such as the CAMS Methane Hotspot Explorer.

Explainable Comparison of Feature-Based and Deep Learning Models for TROPOMI Methane Plume Screening

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理