MMLSv2: A Multimodal Dataset for Martian Landslide Detection in Remote Sensing Imagery

📄 arXiv: 2602.08112v1 📥 PDF

作者: Sidike Paheding, Abel Reyes-Angulo, Leo Thomas Ramos, Angel D. Sappa, Rajaneesh A., Hiral P. B., Sajin Kumar K. S., Thomas Oommen

分类: cs.CV, cs.LG

发布日期: 2026-02-08

🔗 代码/项目: GITHUB


💡 一句话要点

MMLSv2:用于火星遥感影像中滑坡检测的多模态数据集

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 火星滑坡检测 遥感影像 多模态数据集 图像分割 空间泛化

📋 核心要点

  1. 现有火星滑坡检测方法缺乏大规模、多模态数据集,限制了模型的训练和泛化能力。
  2. MMLSv2数据集提供RGB、DEM、坡度等七个通道的多模态数据,旨在提升滑坡检测模型的性能。
  3. 实验表明,MMLSv2数据集支持稳定训练,并在标准测试集上表现良好,但在独立测试集上性能下降,突显了泛化挑战。

📝 摘要(中文)

本文提出了MMLSv2,一个用于火星表面滑坡分割的数据集。MMLSv2包含多模态图像,具有七个通道:RGB、数字高程模型、坡度、热惯量和灰度通道。MMLSv2由664张图像组成,分布在训练集、验证集和测试集中。此外,还发布了一个由276张图像组成的独立测试集,该测试集来自与基础数据集在地理上不相交的区域,用于评估空间泛化能力。使用多个分割模型进行的实验表明,该数据集支持稳定的训练并实现了有竞争力的性能,但仍在碎片化、细长和小规模滑坡区域构成挑战。在独立测试集上的评估导致了明显的性能下降,表明难度增加,并突出了其在评估模型鲁棒性和超出标准同分布设置的泛化能力方面的价值。数据集将在https://github.com/MAIN-Lab/MMLS_v2上提供。

🔬 方法详解

问题定义:论文旨在解决火星遥感图像中滑坡的自动检测与分割问题。现有的火星滑坡检测方法受限于缺乏高质量、大规模、多模态的标注数据集,导致模型难以充分训练,泛化能力不足,尤其是在面对地理分布差异较大的区域时表现更差。

核心思路:论文的核心思路是构建一个包含多种模态信息的火星滑坡数据集,利用不同模态数据之间的互补性,提升模型对滑坡区域的识别能力。通过提供地理位置不相交的独立测试集,更有效地评估模型的空间泛化能力。

技术框架:MMLSv2数据集包含训练集、验证集和测试集,以及一个独立的地理位置不相交的测试集。数据集的图像数据包含七个通道:RGB图像、数字高程模型(DEM)、坡度数据、热惯量数据和灰度图像。研究人员可以使用现有的图像分割模型,如U-Net、DeepLab等,在该数据集上进行训练和评估。

关键创新:MMLSv2的关键创新在于其多模态特性和独立的地理位置不相交的测试集。多模态数据能够提供更全面的滑坡信息,帮助模型更好地理解滑坡的特征。独立的测试集能够更真实地反映模型在实际应用中的泛化能力,避免模型过拟合于特定区域的数据。

关键设计:数据集包含664张图像用于训练、验证和测试,以及276张图像用于独立的地理泛化测试。七个通道的数据分别代表了不同的物理属性,例如RGB图像提供视觉信息,DEM提供地形信息,坡度数据反映了滑坡发生的可能性,热惯量数据则与地表物质的性质相关。数据集的标注质量对模型性能至关重要,但论文中未详细说明标注方法。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,基于MMLSv2数据集训练的分割模型在标准测试集上取得了有竞争力的性能。然而,在地理位置不相交的独立测试集上,模型性能出现了显著下降,这表明模型在空间泛化能力方面仍存在挑战。这一结果突显了MMLSv2数据集对于评估模型鲁棒性和泛化能力的重要性。

🎯 应用场景

MMLSv2数据集可用于训练和评估火星滑坡自动检测模型,辅助行星地质研究,帮助科学家理解火星地貌演化过程,并为未来的火星探测任务提供决策支持。该数据集也可推广到其他行星或卫星的遥感图像分析,用于识别和研究类似的地质现象。

📄 摘要(原文)

We present MMLSv2, a dataset for landslide segmentation on Martian surfaces. MMLSv2 consists of multimodal imagery with seven bands: RGB, digital elevation model, slope, thermal inertia, and grayscale channels. MMLSv2 comprises 664 images distributed across training, validation, and test splits. In addition, an isolated test set of 276 images from a geographically disjoint region from the base dataset is released to evaluate spatial generalization. Experiments conducted with multiple segmentation models show that the dataset supports stable training and achieves competitive performance, while still posing challenges in fragmented, elongated, and small-scale landslide regions. Evaluation on the isolated test set leads to a noticeable performance drop, indicating increased difficulty and highlighting its value for assessing model robustness and generalization beyond standard in-distribution settings. Dataset will be available at: https://github.com/MAIN-Lab/MMLS_v2