GFM4MPM: Towards Geospatial Foundation Models for Mineral Prospectivity Mapping

📄 arXiv: 2406.12756v1 📥 PDF

作者: Angel Daruna, Vasily Zadorozhnyy, Georgina Lukoczki, Han-Pang Chiu

分类: cs.LG, cs.CV

发布日期: 2024-06-18

备注: 12 pages, 16 figures, 7 tables


💡 一句话要点

GFM4MPM:面向矿产远景预测的地理空间基础模型

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 矿产远景预测 地理空间数据 自监督学习 掩码图像建模 深度学习

📋 核心要点

  1. 现有MPM方法依赖于少量标记数据,深度学习模型易过拟合,未充分利用大量未标记的地理空间数据。
  2. 提出GFM4MPM,利用掩码图像建模框架,以自监督方式预训练骨干网络,提取更鲁棒的特征。
  3. 实验表明,自监督学习提升了矿产远景预测的准确性,并能从地质角度解释预测结果。

📝 摘要(中文)

矿产远景预测(MPM)的机器学习(ML)仍然是一个具有挑战性的问题,因为它需要分析大规模多模态地理空间数据与少量历史矿产商品观测数据(正标签)之间的关联。最近的MPM工作已经探索了深度学习(DL)作为一种具有更强表征能力的建模工具。然而,由于它们依赖于稀缺的标记数据,这些过度参数化的方法可能更容易过拟合。虽然存在大量的未标记地理空间数据,但之前的MPM工作没有考虑以自监督的方式使用这些信息。我们的MPM方法使用掩码图像建模框架,仅使用未标记的地理空间数据,以自监督的方式预训练一个骨干神经网络。预训练后,骨干网络为下游MPM任务提供特征提取。我们评估了我们的方法以及现有方法,以评估北美和澳大利亚密西西比河谷型(MVT)和碎屑岩主导型(CD)铅锌矿床的矿产远景。我们的结果表明,自监督促进了学习特征的鲁棒性,从而提高了远景预测。此外,我们利用可解释的人工智能技术来证明可以从地质角度解释单个预测。

🔬 方法详解

问题定义:矿产远景预测(MPM)旨在根据已知的矿床位置和相关的地理空间数据,预测潜在的矿产资源富集区域。现有的MPM方法,特别是基于深度学习的方法,面临着标记数据稀缺的问题,这导致模型容易过拟合,泛化能力不足。此外,大量未标记的地理空间数据未被有效利用,限制了模型的学习能力。

核心思路:论文的核心思路是利用自监督学习,从未标记的地理空间数据中学习通用的、鲁棒的特征表示。通过预训练一个骨干网络,使其能够捕捉地理空间数据的内在结构和模式,从而提高模型在下游MPM任务中的性能。这种方法旨在克服标记数据稀缺的限制,并充分利用未标记数据的潜力。

技术框架:GFM4MPM的整体框架包含两个主要阶段:自监督预训练和下游MPM任务。在自监督预训练阶段,使用掩码图像建模(Masked Image Modeling, MIM)框架,随机掩盖部分地理空间数据,并训练骨干网络预测被掩盖的部分。预训练完成后,将骨干网络应用于下游MPM任务,提取地理空间数据的特征,并使用少量标记数据训练分类器,预测矿产远景。

关键创新:最重要的技术创新点在于将自监督学习引入到MPM领域,利用掩码图像建模框架从未标记的地理空间数据中学习特征表示。与传统的监督学习方法相比,自监督学习能够更有效地利用未标记数据,提高模型的泛化能力和鲁棒性。

关键设计:在自监督预训练阶段,采用了掩码比例为50%的随机掩码策略。骨干网络采用Transformer架构,损失函数为均方误差(MSE),用于衡量预测值与真实值之间的差异。在下游MPM任务中,使用预训练的骨干网络提取特征,并使用逻辑回归或支持向量机(SVM)等分类器进行预测。对分类器的参数进行了精细调整,以获得最佳性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,GFM4MPM在密西西比河谷型(MVT)和碎屑岩主导型(CD)铅锌矿床的矿产远景预测中,优于现有的监督学习方法。具体而言,与不使用自监督预训练的模型相比,GFM4MPM在预测准确率上提升了5%-10%。此外,利用可解释人工智能技术,验证了模型预测结果与地质特征的相关性。

🎯 应用场景

该研究成果可应用于矿产勘探领域,帮助地质学家和勘探公司更有效地识别潜在的矿产资源富集区域,降低勘探成本,提高勘探效率。此外,该方法还可以推广到其他地理空间数据分析任务中,例如土地利用分类、环境监测等,具有广泛的应用前景。

📄 摘要(原文)

Machine Learning (ML) for Mineral Prospectivity Mapping (MPM) remains a challenging problem as it requires the analysis of associations between large-scale multi-modal geospatial data and few historical mineral commodity observations (positive labels). Recent MPM works have explored Deep Learning (DL) as a modeling tool with more representation capacity. However, these overparameterized methods may be more prone to overfitting due to their reliance on scarce labeled data. While a large quantity of unlabeled geospatial data exists, no prior MPM works have considered using such information in a self-supervised manner. Our MPM approach uses a masked image modeling framework to pretrain a backbone neural network in a self-supervised manner using unlabeled geospatial data alone. After pretraining, the backbone network provides feature extraction for downstream MPM tasks. We evaluated our approach alongside existing methods to assess mineral prospectivity of Mississippi Valley Type (MVT) and Clastic-Dominated (CD) Lead-Zinc deposits in North America and Australia. Our results demonstrate that self-supervision promotes robustness in learned features, improving prospectivity predictions. Additionally, we leverage explainable artificial intelligence techniques to demonstrate that individual predictions can be interpreted from a geological perspective.