HOTA: Hierarchical Overlap-Tiling Aggregation for Large-Area 3D Flood Mapping

📄 arXiv: 2507.07585v1 📥 PDF

作者: Wenfeng Jia, Bin Liang, Yuxi Lu, Attavit Wilaiwongsakul, Muhammad Arif Khan, Lihong Zheng

分类: cs.CV, eess.IV

发布日期: 2025-07-10

DOI: 10.1007/978-981-95-4398-4_14


💡 一句话要点

提出HOTA:一种用于大面积3D洪水制图的分层重叠平铺聚合方法

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 洪水制图 遥感图像 语义分割 深度估计 多尺度推理

📋 核心要点

  1. 现有洪水制图方法难以兼顾空间细节和覆盖范围,且常忽略洪水深度信息,限制了灾害响应的有效性。
  2. HOTA通过分层重叠平铺聚合策略,结合SegFormer和双约束深度估计模块,实现高精度大范围3D洪水制图。
  3. 实验表明,HOTA相较于U-Net基线,IoU从73%提升至84%,3D表面平均绝对边界误差小于0.5米。

📝 摘要(中文)

洪水是最常见的自然灾害之一,会造成重大的社会和经济损失。及时、大规模的洪水范围和深度信息对于灾害响应至关重要;然而,现有的产品通常以牺牲空间细节来换取覆盖范围,或者完全忽略洪水深度。为了弥合这一差距,本研究提出了HOTA:分层重叠平铺聚合,一种即插即用的多尺度推理策略。当与SegFormer和双约束深度估计模块结合使用时,该方法构成了一个完整的3D洪水制图流程。HOTA仅在推理期间将不同大小的重叠瓦片应用于多光谱Sentinel-2图像,使SegFormer模型能够在不改变网络权重或重新训练的情况下捕获局部特征和公里级淹没情况。随后的深度模块基于数字高程模型(DEM)差分方法,通过强制执行(i)沿洪水边界的零深度和(ii)相对于DEM的近乎恒定的洪水体积来细化2D掩模并估计洪水深度。对2021年3月肯普西(澳大利亚)洪水的案例研究表明,HOTA与SegFormer结合使用时,IoU从73%(U-Net基线)提高到84%。由此产生的3D表面实现了小于0.5米的平均绝对边界误差。这些结果表明,HOTA可以生成准确的大面积3D洪水地图,适用于快速灾害响应。

🔬 方法详解

问题定义:现有的大面积洪水制图方法通常需要在空间细节和覆盖范围之间进行权衡,并且常常忽略了洪水深度的估计。这导致生成的洪水地图在灾害响应中的实用性受到限制,无法提供足够精确的信息来支持救援和资源分配。现有方法的痛点在于难以在保证覆盖范围的同时,提供高分辨率的洪水范围和深度信息。

核心思路:HOTA的核心思路是通过一种多尺度的推理策略,即分层重叠平铺聚合,来充分利用遥感图像中的信息。通过在不同尺度上对图像进行分割和处理,模型可以同时捕捉到局部细节和全局上下文信息。此外,结合数字高程模型(DEM)差分方法,可以有效地估计洪水深度,从而生成完整的3D洪水地图。这种设计旨在克服现有方法在空间分辨率和覆盖范围之间的trade-off。

技术框架:HOTA洪水制图流程主要包含以下几个阶段:1) 使用Sentinel-2多光谱图像作为输入;2) 应用HOTA策略,将图像分割成不同大小的重叠瓦片;3) 使用SegFormer模型对每个瓦片进行洪水范围分割;4) 利用数字高程模型(DEM)差分方法,结合双约束条件(洪水边界零深度和近乎恒定的洪水体积)估计洪水深度;5) 将各个瓦片的分割结果和深度估计结果进行聚合,生成最终的3D洪水地图。

关键创新:HOTA最重要的技术创新点在于其分层重叠平铺聚合策略。与传统的单尺度分割方法相比,HOTA能够更好地捕捉图像中的多尺度信息,从而提高分割的准确性。此外,通过引入双约束深度估计模块,可以有效地利用DEM数据来估计洪水深度,从而生成更完整的3D洪水地图。HOTA的本质区别在于其多尺度推理和深度估计方法,使其能够在大面积区域内生成高分辨率的3D洪水地图。

关键设计:HOTA的关键设计包括:1) 使用不同大小的重叠瓦片,以捕捉不同尺度的信息;2) 使用SegFormer作为洪水范围分割模型,利用其强大的语义分割能力;3) 设计双约束深度估计模块,利用DEM数据和物理约束来提高深度估计的准确性。具体而言,双约束条件包括:沿洪水边界强制执行零深度,以及保持相对于DEM的近乎恒定的洪水体积。这些约束条件有助于减少深度估计的误差,并生成更真实的3D洪水地图。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,HOTA与SegFormer结合使用时,在2021年3月肯普西(澳大利亚)洪水的案例研究中,IoU从U-Net基线的73%提高到84%。此外,生成的3D表面实现了小于0.5米的平均绝对边界误差。这些数据表明,HOTA能够显著提高洪水制图的准确性,并生成高质量的3D洪水地图。

🎯 应用场景

该研究成果可广泛应用于灾害管理、城市规划和水资源管理等领域。生成的3D洪水地图能够为灾害响应提供及时、准确的信息,帮助救援人员进行资源分配和疏散计划。此外,该技术还可以用于评估洪水风险,指导城市规划和基础设施建设,以及优化水资源管理策略,从而减少洪水带来的社会和经济损失。

📄 摘要(原文)

Floods are among the most frequent natural hazards and cause significant social and economic damage. Timely, large-scale information on flood extent and depth is essential for disaster response; however, existing products often trade spatial detail for coverage or ignore flood depth altogether. To bridge this gap, this work presents HOTA: Hierarchical Overlap-Tiling Aggregation, a plug-and-play, multi-scale inference strategy. When combined with SegFormer and a dual-constraint depth estimation module, this approach forms a complete 3D flood-mapping pipeline. HOTA applies overlapping tiles of different sizes to multispectral Sentinel-2 images only during inference, enabling the SegFormer model to capture both local features and kilometre-scale inundation without changing the network weights or retraining. The subsequent depth module is based on a digital elevation model (DEM) differencing method, which refines the 2D mask and estimates flood depth by enforcing (i) zero depth along the flood boundary and (ii) near-constant flood volume with respect to the DEM. A case study on the March 2021 Kempsey (Australia) flood shows that HOTA, when coupled with SegFormer, improves IoU from 73\% (U-Net baseline) to 84\%. The resulting 3D surface achieves a mean absolute boundary error of less than 0.5 m. These results demonstrate that HOTA can produce accurate, large-area 3D flood maps suitable for rapid disaster response.