EarthScape: A Multimodal Dataset for Surficial Geologic Mapping and Earth Surface Analysis
作者: Matthew Massey, Abdullah-Al-Zubaer Imran
分类: cs.CV
发布日期: 2025-03-19
🔗 代码/项目: GITHUB
💡 一句话要点
EarthScape:用于地表地质填图和地球表面分析的多模态数据集
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 地表地质填图 多模态数据集 遥感数据 地球表面分析 计算机视觉 地理空间分析 机器学习
📋 核心要点
- 传统地表地质填图方法耗时费力,限制了空间覆盖范围,并可能引入人为偏差,难以满足现代地球科学研究的需求。
- EarthScape数据集通过整合多源遥感数据,包括RGB、近红外图像、DEM以及地形特征和矢量数据,为地表地质填图提供AI可用的数据基础。
- 论文构建了完整的数据处理流程,并使用不同空间模态建立了基线性能,验证了EarthScape数据集在地表地质分析中的有效性。
📝 摘要(中文)
地表地质填图对于理解地球表面过程至关重要,有助于应对气候变化和国家安全等现代挑战,并支持工程和资源管理中的常见应用。然而,传统的填图方法劳动强度大,限制了空间覆盖范围,并可能引入偏差。为了解决这些局限性,我们推出了EarthScape,这是一个新颖的、AI-就绪的多模态数据集,专门为地表地质填图和地球表面分析而设计。EarthScape集成了高分辨率航空RGB和近红外(NIR)图像、数字高程模型(DEM)、多尺度DEM衍生的地形特征以及水文和基础设施矢量数据。该数据集为七个不同的地表地质类别提供了详细的注释,涵盖了各种地质过程。我们提出了一个使用开源原始数据的综合数据处理流程,并使用不同的空间模态建立基线基准,以证明EarthScape的实用性。作为一个具有扩展愿景的动态数据集,EarthScape弥合了计算机视觉和地球科学之间的差距,为推进多模态学习、地理空间分析和地质填图的研究提供了宝贵的资源。我们的代码可在https://github.com/masseygeo/earthscape获取。
🔬 方法详解
问题定义:论文旨在解决传统地表地质填图方法效率低、覆盖范围有限以及存在主观偏差的问题。现有方法难以有效利用多源遥感数据,缺乏适用于机器学习模型的标注数据集。
核心思路:论文的核心思路是构建一个多模态、AI-ready的地表地质数据集,该数据集包含多种遥感数据(RGB、NIR、DEM等)和详细的地质类别标注,从而为利用机器学习方法进行地表地质填图和地球表面分析提供数据基础。
技术框架:EarthScape数据集的构建流程主要包括以下几个阶段:1) 数据收集:收集高分辨率航空RGB和近红外(NIR)图像、数字高程模型(DEM)、多尺度DEM衍生的地形特征以及水文和基础设施矢量数据。2) 数据处理:对原始数据进行预处理,包括几何校正、辐射校正、DEM生成等。3) 数据融合:将不同来源的数据进行融合,形成多模态数据集。4) 数据标注:对地表地质类别进行详细标注。5) 基线模型建立:使用不同的空间模态建立基线基准。
关键创新:EarthScape数据集的关键创新在于其多模态特性和AI-ready的设计。它整合了多种遥感数据,并提供了详细的地质类别标注,使得研究人员可以利用机器学习方法进行地表地质填图和地球表面分析。此外,该数据集还提供了一个完整的数据处理流程和基线性能,方便研究人员使用和评估。
关键设计:EarthScape数据集包含了七个不同的地表地质类别,涵盖了各种地质过程。数据集的空间分辨率较高,能够提供详细的地表信息。论文还公开了数据处理的代码,方便研究人员复现和扩展。
🖼️ 关键图片
📊 实验亮点
论文构建了包含多种遥感数据和详细地质标注的EarthScape数据集,并使用不同空间模态建立了基线性能。实验结果表明,该数据集能够有效支持地表地质填图和地球表面分析任务,为相关研究提供了有价值的资源。
🎯 应用场景
EarthScape数据集可广泛应用于地表地质填图、地球表面过程研究、气候变化影响评估、自然资源管理、工程建设选址、灾害风险评估等领域。该数据集为利用人工智能技术解决地球科学问题提供了新的机遇,有望推动相关领域的研究进展。
📄 摘要(原文)
Surficial geologic mapping is essential for understanding Earth surface processes, addressing modern challenges such as climate change and national security, and supporting common applications in engineering and resource management. However, traditional mapping methods are labor-intensive, limiting spatial coverage and introducing potential biases. To address these limitations, we introduce EarthScape, a novel, AI-ready multimodal dataset specifically designed for surficial geologic mapping and Earth surface analysis. EarthScape integrates high-resolution aerial RGB and near-infrared (NIR) imagery, digital elevation models (DEM), multi-scale DEM-derived terrain features, and hydrologic and infrastructure vector data. The dataset provides detailed annotations for seven distinct surficial geologic classes encompassing various geological processes. We present a comprehensive data processing pipeline using open-sourced raw data and establish baseline benchmarks using different spatial modalities to demonstrate the utility of EarthScape. As a living dataset with a vision for expansion, EarthScape bridges the gap between computer vision and Earth sciences, offering a valuable resource for advancing research in multimodal learning, geospatial analysis, and geological mapping. Our code is available at https://github.com/masseygeo/earthscape.