Ecological mapping with geospatial foundation models

📄 arXiv: 2602.10720v1 📥 PDF

作者: Craig Mahlasi, Gciniwe S. Baloyi, Zaheed Gaffoor, Levente Klein, Anne Jones, Etienne Vos, Michal Muszynski, Geoffrey Dawson, Campbell Watson

分类: cs.CV

发布日期: 2026-02-11


💡 一句话要点

利用地理空间基础模型进行生态制图研究,TerraMind表现优异

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 地理空间基础模型 生态制图 遥感影像 土地利用分类 森林功能性状 泥炭地检测 模型微调

📋 核心要点

  1. 生态制图任务面临数据标注成本高、模型泛化能力弱等挑战,传统方法难以有效利用大规模遥感数据。
  2. 本研究探索了地理空间基础模型(GFMs)在生态制图中的应用,通过微调预训练模型来提升性能。
  3. 实验结果表明,GFMs在土地利用分类、森林功能性状制图和泥炭地检测等任务中优于传统ResNet模型。

📝 摘要(中文)

地理空间基础模型(GFMs)正迅速成为各种地理空间任务(如生态制图)的新范式。本研究旨在探索GFMs在生态应用中的效用、挑战和机遇。为此,我们针对三个用例对几个预训练的AI模型(Prithvi-E0-2.0和TerraMind)进行了微调,并将其与基线ResNet-101模型进行了比较。首先,我们展示了TerraMind的土地利用/土地覆盖(LULC)生成能力。最后,我们探索了GFMs在森林功能性状制图和泥炭地检测中的效用。在所有实验中,GFMs都优于基线ResNet模型。总体而言,TerraMind略优于Prithvi。然而,通过添加额外的模态,TerraMind显著优于基线ResNet和Prithvi模型。尽管如此,应考虑输入数据与预训练模态的差异。我们注意到,这些模型将受益于更高的分辨率和更准确的标签,特别是在需要绘制像素级动态的用例中。

🔬 方法详解

问题定义:论文旨在解决生态制图领域中,利用遥感数据进行土地利用/土地覆盖分类、森林功能性状制图和泥炭地检测等任务。现有方法,如基于ResNet的模型,在处理复杂生态环境和大规模遥感数据时,泛化能力不足,且需要大量标注数据进行训练,成本较高。

核心思路:论文的核心思路是利用预训练的地理空间基础模型(GFMs),如Prithvi-E0-2.0和TerraMind,通过微调的方式,将这些模型迁移到特定的生态制图任务中。GFMs在大规模地理空间数据上进行了预训练,具备较强的特征提取和泛化能力,可以有效降低对标注数据的依赖,并提升模型性能。

技术框架:整体框架包括以下几个步骤:1) 选择合适的GFM模型(Prithvi-E0-2.0或TerraMind);2) 准备特定生态制图任务的数据集,包括遥感影像和对应的标签;3) 对GFM模型进行微调,使用特定数据集进行训练;4) 在测试集上评估模型性能,并与基线模型(ResNet-101)进行比较。针对不同的生态制图任务,可能需要调整输入数据的模态,例如,在森林功能性状制图中,可以加入额外的光谱信息。

关键创新:论文的关键创新在于将GFMs引入生态制图领域,并验证了其有效性。与传统方法相比,GFMs能够更好地利用大规模遥感数据,提取更丰富的特征,从而提升模型性能。此外,通过微调的方式,可以快速适应不同的生态制图任务,降低了开发成本。

关键设计:论文中,针对不同的生态制图任务,选择了合适的GFM模型和输入数据模态。例如,在土地利用/土地覆盖分类任务中,使用了TerraMind模型,并利用其强大的LULC生成能力。在森林功能性状制图中,考虑了光谱信息的影响,并将其作为额外的输入模态。损失函数和网络结构等技术细节未在摘要中详细说明,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,GFMs在土地利用分类、森林功能性状制图和泥炭地检测等任务中均优于基线ResNet-101模型。TerraMind在大多数任务中表现略优于Prithvi-E0-2.0,并且在添加额外模态后,TerraMind的性能提升更为显著。具体性能提升数据未在摘要中给出,属于未知信息。

🎯 应用场景

该研究成果可应用于生态监测、环境保护、土地资源管理等领域。通过GFMs,可以更快速、更准确地进行土地利用分类、森林资源评估和湿地保护等工作,为相关决策提供科学依据。未来,结合更高分辨率的遥感数据和更精确的标签,GFMs有望在生态制图领域发挥更大的作用。

📄 摘要(原文)

Geospatial foundation models (GFMs) are a fast-emerging paradigm for various geospatial tasks, such as ecological mapping. However, the utility of GFMs has not been fully explored for high-value use cases. This study aims to explore the utility, challenges and opportunities associated with the application of GFMs for ecological uses. In this regard, we fine-tune several pretrained AI models, namely, Prithvi-E0-2.0 and TerraMind, across three use cases, and compare this with a baseline ResNet-101 model. Firstly, we demonstrate TerraMind's LULC generation capabilities. Lastly, we explore the utility of the GFMs in forest functional trait mapping and peatlands detection. In all experiments, the GFMs outperform the baseline ResNet models. In general TerraMind marginally outperforms Prithvi. However, with additional modalities TerraMind significantly outperforms the baseline ResNet and Prithvi models. Nonetheless, consideration should be given to the divergence of input data from pretrained modalities. We note that these models would benefit from higher resolution and more accurate labels, especially for use cases where pixel-level dynamics need to be mapped.