FARM: Fine-Tuning Geospatial Foundation Models for Intra-Field Crop Yield Regression
作者: Shayan Nejadshamsi, Yuanyuan Zhang, Shadi Zaki, Brock Porth, Lysa Porth, Vahab Khoshdel
分类: cs.CV, cs.LG, eess.IV
发布日期: 2025-10-30 (更新: 2025-12-17)
DOI: 10.3390/agriengineering8010002
💡 一句话要点
FARM:微调地理空间基础模型,用于田间作物产量回归
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 精准农业 作物产量预测 地理空间基础模型 微调 遥感 深度学习 迁移学习
📋 核心要点
- 传统作物产量预测方法缺乏可扩展性和精细度,难以满足精准农业的需求。
- FARM通过微调预训练的地理空间基础模型,将多时相卫星图像转化为高分辨率产量图。
- 实验表明,FARM在产量预测精度上优于传统方法,且在数据稀缺情况下仍表现良好。
📝 摘要(中文)
精准且及时的作物产量预测对于全球粮食安全和现代农业管理至关重要。传统方法通常缺乏精细农业所需的可扩展性和粒度。本文提出了FARM(微调农业回归模型),这是一个深度学习框架,专为高分辨率、田间油菜产量预测而设计。FARM利用预训练的大规模地理空间基础模型(Prithvi-EO-2.0-600M),并将其调整为连续回归任务,将多时相卫星图像转换为密集的像素级(30米)产量图。在加拿大草原的综合数据集上评估,FARM实现了0.44的均方根误差(RMSE)和0.81的R^2。使用独立的高分辨率产量监测数据集,我们进一步表明,在有限的真实标签上微调FARM优于从头开始训练相同的架构,证实了在大规模、上采样的县级数据上进行预训练对于数据稀缺的精准农业的好处。这些结果优于3D-CNN和DeepYield等基线架构,突出了微调基础模型对于专业农业应用的有效性。通过提供连续的高分辨率输出,FARM为精准农业提供了一种比传统分类或县级聚合方法更具可操作性的工具。这项工作验证了一种新颖的方法,弥合了大规模地球观测和农场决策之间的差距,为详细的农业监测提供了一种可扩展的解决方案。
🔬 方法详解
问题定义:论文旨在解决高分辨率、田间尺度的作物产量预测问题。现有方法,如传统统计模型或浅层机器学习模型,难以处理复杂的多时相遥感数据,且泛化能力有限。深度学习方法虽然有所发展,但通常需要大量标注数据,而田间尺度的精确产量数据获取成本高昂。因此,如何在数据稀缺的情况下,实现精准的田间产量预测是本研究要解决的核心问题。
核心思路:论文的核心思路是利用预训练的地理空间基础模型,通过微调的方式,将其迁移到田间作物产量回归任务中。预训练模型在大规模遥感数据上学习了丰富的地理空间特征,可以作为良好的初始化参数,从而减少对目标任务标注数据的依赖。这种迁移学习的方法能够有效提升模型在数据稀缺场景下的泛化能力和预测精度。
技术框架:FARM框架主要包含以下几个阶段:1) 数据预处理:对多时相卫星图像进行校正、配准和标准化等处理。2) 特征提取:利用预训练的Prithvi-EO-2.0-600M模型提取遥感图像的特征。3) 微调:将预训练模型的输出连接到回归层,并在田间产量数据上进行微调,优化模型参数。4) 产量预测:利用微调后的模型,预测每个像素点的作物产量。
关键创新:论文的关键创新在于将大规模地理空间基础模型应用于田间作物产量预测。与传统的从头开始训练深度学习模型的方法相比,FARM充分利用了预训练模型学习到的通用地理空间知识,从而在数据稀缺的情况下实现了更高的预测精度。此外,FARM直接预测像素级别的产量,提供了比传统县级或区域级预测更精细的结果,更适用于精准农业应用。
关键设计:FARM使用了Prithvi-EO-2.0-600M作为基础模型,该模型是一个在大规模地球观测数据上预训练的Transformer模型。微调阶段,论文采用了均方误差(MSE)作为损失函数,优化模型预测产量与真实产量之间的差异。为了防止过拟合,论文还采用了dropout和权重衰减等正则化技术。此外,论文还探索了不同的微调策略,例如冻结部分模型参数或调整学习率等。
🖼️ 关键图片
📊 实验亮点
实验结果表明,FARM在加拿大草原数据集上实现了0.44的RMSE和0.81的R^2,显著优于3D-CNN和DeepYield等基线模型。更重要的是,在有限的真实标签上微调FARM,其性能优于从头开始训练相同的架构,验证了预训练的有效性。这表明FARM在数据稀缺的精准农业场景下具有显著优势。
🎯 应用场景
FARM可应用于精准农业领域,为农民提供田间尺度的作物产量预测,辅助决策,例如精准施肥、灌溉和病虫害防治。该技术还可用于农业保险、产量评估和粮食安全监测等领域,具有重要的社会和经济价值。未来,FARM可以扩展到其他作物和地区,并与其他农业数据源(如气象数据、土壤数据)相结合,进一步提升预测精度和应用范围。
📄 摘要(原文)
Accurate and timely crop yield prediction is crucial for global food security and modern agricultural management. Traditional methods often lack the scalability and granularity required for precision farming. This paper introduces FARM: Fine-tuning Agricultural Regression Models, a deep learning framework designed for high-resolution, intra-field canola yield prediction. FARM leverages a pre-trained, large-scale geospatial foundation model (Prithvi-EO-2.0-600M) and adapts it for a continuous regression task, transforming multi-temporal satellite imagery into dense, pixel-level (30 m) yield maps. Evaluated on a comprehensive dataset from the Canadian Prairies, FARM achieves a Root Mean Squared Error (RMSE) of 0.44 and an R^2 of 0.81. Using an independent high-resolution yield monitor dataset, we further show that fine-tuning FARM on limited ground-truth labels outperforms training the same architecture from scratch, confirming the benefit of pre-training on large, upsampled county-level data for data-scarce precision agriculture. These results represent improvement over baseline architectures like 3D-CNN and DeepYield, which highlight the effectiveness of fine-tuning foundation models for specialized agricultural applications. By providing a continuous, high-resolution output, FARM offers a more actionable tool for precision agriculture than conventional classification or county-level aggregation methods. This work validates a novel approach that bridges the gap between large-scale Earth observation and on-farm decision-making, offering a scalable solution for detailed agricultural monitoring.