Low-Rank Adaptation of Geospatial Foundation Models for Wildfire Mapping Using Sentinel-2 Data

📄 arXiv: 2605.04989v1 📥 PDF

作者: Ali Shibli, Andrea Nascetti, Yifang Ban

分类: cs.CV

发布日期: 2026-05-06

备注: Accepted at IGARSS 2026

🔗 代码/项目: GITHUB


💡 一句话要点

提出LoRA方法高效适配地理空间基础模型,用于Sentinel-2数据火灾范围制图

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 地理空间基础模型 低秩适应 野火制图 Sentinel-2 领域泛化

📋 核心要点

  1. 现有方法难以有效适配地理空间基础模型,尤其是在时空领域偏移下,导致火灾范围制图精度受限。
  2. 利用低秩适应(LoRA)方法,仅需微调少量参数即可实现地理空间基础模型在火灾范围制图任务上的高效迁移。
  3. 实验结果表明,LoRA方法在跨域泛化能力上表现出色,且Prithvi-v2结合LoRA取得了最高的总体准确率。

📝 摘要(中文)

野火燃烧面积制图对于灾害评估、排放建模以及理解不同生态区域的火灾-气候相互作用至关重要。近期的地理空间基础模型为卫星图像提供了强大的通用表示,但如何有效地调整这些模型以适应下游地球观测任务,特别是在地理和时间领域偏移下,仍然缺乏清晰的理解。本研究评估了三种最先进的地理空间基础模型(GFM):Terramind、DINOv3和Prithvi-v2,利用Sentinel-2数据在美国和加拿大进行燃烧面积制图。利用2017-2023年的3820次野火事件,我们进行了跨不同生物群落的空间和时间泛化测试。我们系统地比较了完全微调、仅解码器微调和低秩适应(LoRA)来调整每个模型。在所有实验中,LoRA提供了最强的跨域泛化能力,同时更新的参数不到1%,证明了准确性和效率之间的良好权衡。Prithvi-v2与LoRA相结合实现了最高的总体准确率,并且相比于完全微调具有最大的改进。这些发现表明,地理空间基础模型在采用轻量级参数高效方法(如LoRA)进行调整时,为大规模燃烧面积制图提供了一个稳健且可扩展的解决方案。

🔬 方法详解

问题定义:论文旨在解决如何高效地将预训练的地理空间基础模型(GFMs)应用于特定下游任务,即利用Sentinel-2数据进行野火燃烧面积制图的问题。现有方法,如完全微调,计算成本高昂,且容易过拟合,尤其是在数据量有限或存在领域偏移的情况下。

核心思路:论文的核心思路是利用低秩适应(LoRA)方法,通过在预训练模型的每一层注入少量可训练的低秩矩阵,从而在微调过程中仅更新这些新增的参数,而冻结原始模型的参数。这样既能保留预训练模型的通用知识,又能高效地适应特定任务,降低计算成本,并提高泛化能力。

技术框架:整体框架包括以下步骤:1) 选择预训练的地理空间基础模型(Terramind, DINOv3, Prithvi-v2);2) 在模型的每一层注入LoRA模块;3) 使用Sentinel-2数据和野火事件数据对模型进行微调,仅更新LoRA模块的参数;4) 在不同的地理区域和时间段进行测试,评估模型的泛化能力。

关键创新:最重要的技术创新点是LoRA在地理空间基础模型微调中的应用。与完全微调相比,LoRA显著减少了需要训练的参数数量,从而降低了计算成本,并提高了模型的泛化能力,尤其是在存在领域偏移的情况下。

关键设计:LoRA模块的关键设计包括低秩矩阵的秩的选择(论文中未明确给出具体数值,但强调了参数量小于1%),以及LoRA模块在模型中的注入位置(每一层)。损失函数采用标准的交叉熵损失函数,优化器采用AdamW优化器,学习率等超参数的选择需要根据具体模型和数据集进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,LoRA方法在所有实验中均表现出最强的跨域泛化能力,同时更新的参数不到1%。Prithvi-v2与LoRA相结合实现了最高的总体准确率,并且相比于完全微调具有显著的性能提升。这些结果验证了LoRA方法在地理空间基础模型微调中的有效性和高效性。

🎯 应用场景

该研究成果可应用于大规模野火监测与评估,为灾害管理、生态环境保护和气候变化研究提供技术支持。通过高效适配地理空间基础模型,可以快速准确地绘制火灾范围,评估损失,并为制定合理的应对措施提供依据。未来,该方法还可推广到其他地球观测任务,如土地覆盖分类、森林健康监测等。

📄 摘要(原文)

Wildfire burned-area mapping is essential for damage assessment, emissions modeling, and understanding fire-climate interactions across diverse ecological regions. Recent geospatial foundation models provide strong general-purpose representations for satellite imagery, yet there is still no clear understanding of how to efficiently adapt these models for downstream Earth observation tasks, particularly under geographic and temporal domain shift. This study evaluates three state-of-the-art Geospatial Foundation Models (GFMs) - Terramind, DINOv3, and Prithvi-v2 - for burned-area mapping across the United States and Canada using Sentinel-2 data. Leveraging 3,820 wildfire events from 2017-2023, we conduct spatial and temporal generalization tests across diverse biomes. We systematically compare full fine-tuning, decoder-only fine-tuning, and Low-Rank Adaptation (LoRA) for adapting each model. Across all experiments, LoRA provides the strongest cross-domain generalization while updating less than 1% of parameters, demonstrating a favorable trade-off between accuracy and efficiency. Prithvi-v2 with LoRA achieves the highest overall accuracy and the largest improvement compared to full fine-tuning. These findings indicate that geospatial foundation models, when adapted using lightweight parameter-efficient methods such as LoRA, offer a robust and scalable solution for large-scale burned-area mapping. Code is available at https://github.com/alishibli97/wildfire-lora-gfm.