Continental-scale habitat distribution modelling with multimodal earth observation foundation models
作者: Sara Si-Moussi, Stephan Hennekens, Sander Mucher, Stan Los, Yoann Cartier, Borja Jiménez-Alfaro, Fabio Attorre, Jens-Christian Svenning, Wilfried Thuiller
分类: cs.LG, q-bio.PE, stat.AP
发布日期: 2025-07-13 (更新: 2025-10-27)
💡 一句话要点
利用多模态地球观测基础模型进行洲际尺度生境分布建模
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 生境分布建模 地球观测 遥感 机器学习 类别不平衡
📋 核心要点
- 现有生境地图在主题和空间分辨率上不足,难以应对多生境类型共存和类别不平衡问题。
- 利用地球观测基础模型整合多光谱和雷达遥感数据,并结合生境分类的层次结构,提升生境区分能力。
- 通过集成机器学习纠正类别不平衡,显著提高生境分布预测的准确性,并验证了方法的可迁移性。
📝 摘要(中文)
生境整合了支持生物多样性和人类福祉的非生物条件、植被组成和结构。大多数生境面临着来自人类活动的日益增长的压力,这需要准确、高分辨率的生境图,以实现有效的保护和恢复。然而,当前的生境图通常在主题或空间分辨率上存在不足,因为它们必须(1)对景观中共同存在的几种互斥的生境类型进行建模,并且(2)应对严重的类别不平衡,这使得详尽的多类别训练变得复杂。本文评估了高分辨率遥感(RS)数据和人工智能(AI)工具如何改善欧洲大范围区域内精细空间和主题分辨率的生境绘图。利用欧洲植被档案中的植被样地,对欧洲三级EUNIS生境类型的分布进行建模,并针对独立的验证数据集评估了多种建模策略。利用生境分类的层次结构的策略解决了分类模糊性,尤其是在破碎的生境中。整合星载多光谱和雷达图像,特别是通过地球观测(EO)基础模型(EO-FM),增强了地层内的区分和整体性能。最后,纠正类别不平衡的集成机器学习进一步提高了预测精度。该方法框架可推广到欧洲以外的地区,并适用于其他分类系统。未来的研究应推进生境动态的时间建模,扩展到生境分割和质量评估,并利用下一代EO数据与更高质量的现场观测相结合。
🔬 方法详解
问题定义:论文旨在解决大尺度、高分辨率生境分布建模的问题。现有方法在处理多个共存生境类型和类别不平衡数据时表现不佳,导致生境地图在主题和空间分辨率上存在不足。
核心思路:论文的核心思路是利用多模态遥感数据(多光谱和雷达)和地球观测基础模型(EO-FM)提取更丰富的生境特征,并结合生境分类的层次结构来减少分类模糊性。同时,采用集成机器学习方法来解决类别不平衡问题,从而提高生境分布预测的准确性和鲁棒性。
技术框架:整体框架包括以下几个主要阶段:1) 数据准备:收集欧洲植被档案中的植被样地数据和多模态遥感数据。2) 特征提取:利用EO-FM从遥感数据中提取生境特征。3) 模型训练:使用集成机器学习算法(如随机森林、梯度提升等)训练生境分布预测模型。4) 模型评估:使用独立的验证数据集评估模型的性能。5) 结果分析:分析不同建模策略和数据源对模型性能的影响。
关键创新:论文的关键创新在于:1) 将地球观测基础模型应用于生境分布建模,有效利用了多模态遥感数据。2) 结合生境分类的层次结构,减少了分类模糊性,提高了模型对破碎生境的识别能力。3) 采用集成机器学习方法,有效解决了类别不平衡问题。
关键设计:论文的关键设计包括:1) 选择合适的EO-FM模型,并针对生境分布建模任务进行微调或特征提取。2) 设计合适的集成机器学习算法,并调整算法参数以优化模型性能。3) 采用合适的评估指标,如F1-score、AUC等,来评估模型的性能。
📊 实验亮点
研究结果表明,结合地球观测基础模型和生境分类层次结构的建模策略,能够显著提高生境分布预测的准确性。集成机器学习方法在纠正类别不平衡方面表现出色,进一步提升了模型性能。实验验证了该方法框架在欧洲大陆尺度上的有效性和可迁移性。
🎯 应用场景
该研究成果可应用于生物多样性保护、生态系统管理、土地利用规划和气候变化影响评估等领域。高精度生境分布图能够为保护区规划、生态修复和可持续发展提供科学依据,并有助于监测和评估人类活动对生态环境的影响。该方法框架具有可迁移性,可应用于其他地区和分类系统。
📄 摘要(原文)
Habitats integrate the abiotic conditions, vegetation composition and structure that support biodiversity and sustain nature's contributions to people. Most habitats face mounting pressures from human activities, which requires accurate, high-resolution habitat mapping for effective conservation and restoration. Yet, current habitat maps often fall short in thematic or spatial resolution because they must (1) model several mutually exclusive habitat types that co-occur across landscapes and (2) cope with severe class imbalance that complicates exhaustive multi-class training. Here, we evaluated how high-resolution remote sensing (RS) data and Artificial Intelligence (AI) tools can improve habitat mapping across large geographical extents at fine spatial and thematic resolution. Using vegetation plots from the European Vegetation Archive, we modelled the distribution of Level 3 EUNIS habitat types across Europe and assessed multiple modelling strategies against independent validation datasets. Strategies that exploited the hierarchical nature of habitat classifications resolved classification ambiguities, especially in fragmented habitats. Integrating satellite-borne multispectral and radar imagery, particularly through Earth Observation (EO) Foundation models (EO-FMs), enhanced within-formation discrimination and overall performance. Finally, ensemble machine learning that corrects class imbalance boosted predictive accuracy even further. Our methodological framework is transferable beyond Europe and adaptable to other classification systems. Future research should advance temporal modelling of habitat dynamics, extend to habitat segmentation and quality assessment, and exploit next-generation EO data paired with higher-quality in situ observations.