SatSurfGS: Generalizable 2D Gaussian Splatting for Sparse-View Satellite Surface Reconstruction

📄 arXiv: 2605.07181v1 📥 PDF

作者: Min Chen, Wei Guo, Bin Wang, Wen Li, Tong Fang, Jinbo Zhang, Junqi Zhao, Hong Kuang, Han Hu, Xuming Ge, Qing Zhu, Bo Xu

分类: cs.CV

发布日期: 2026-05-08


💡 一句话要点

提出SatSurfGS:一种基于2D高斯溅射的通用稀疏视角卫星表面重建框架

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 2D高斯溅射 卫星遥感 稀疏视角重建 通用模型 多视角立体视觉 置信度建模

📋 核心要点

  1. 卫星影像在稀疏视角下受光照、纹理及几何约束分布不均影响,导致多视角匹配的可靠性存在显著的空间异质性。
  2. 提出SatSurfGS框架,通过从粗到细的预测策略,在特征融合、参数估计及优化阶段引入置信度建模,实现鲁棒的表面重建。
  3. 实验证明该方法在渲染质量、重建精度及跨数据集泛化性上均显著优于现有的通用型及单场景优化型基线方法。

📝 摘要(中文)

稀疏视角卫星图像表面重建极具挑战性,主要源于卫星成像条件下多视角匹配的可靠性存在显著的空间异质性。受光度差异大、纹理弱及重复纹理等因素影响,多视角几何约束往往稀疏、分布不均且局部不可靠。尽管2D高斯溅射(2DGS)在显式表示连续表面方面优于3DGS,但针对稀疏视角卫星表面重建的通用前馈2DGS框架研究尚属空白。为此,本文提出了SatSurfGS,一种基于2DGS的通用稀疏视角卫星表面重建方法。该方法构建了从粗到细的高斯属性预测框架,并在特征学习、高斯参数估计和训练优化三个层面显式建模局部几何可靠性。具体包括:置信度感知的单目多视角特征融合模块、跨阶段自一致性残差引导模块以及置信度双向路由损失。实验表明,该方法在渲染质量、表面重建精度、跨数据集泛化能力及推理效率方面均优于现有基线方法。

🔬 方法详解

问题定义:卫星遥感影像在稀疏视角下,由于光照剧烈变化、弱纹理区域及重复纹理干扰,导致传统多视角立体视觉(MVS)匹配产生的几何约束极不稳定,难以实现高质量的连续表面重建。

核心思路:利用2DGS在表面建模上的优势,通过引入“置信度”这一核心变量,在特征提取、参数回归和损失函数设计中动态分配权重,从而屏蔽不可靠区域的干扰,增强模型对复杂卫星场景的泛化能力。

技术框架:SatSurfGS采用从粗到细的预测架构。首先通过置信度感知的特征融合模块整合单目先验与多视角特征;随后利用跨阶段残差引导模块对高斯参数进行迭代细化;最后通过置信度双向路由损失实现几何与外观监督的解耦。

关键创新:引入了显式的局部几何可靠性建模,改变了以往方法对所有像素一视同仁的优化策略,实现了对卫星影像中异质性区域的自适应处理。

关键设计:核心组件包括:1. 置信度感知融合模块,动态加权单目先验与匹配特征;2. 跨阶段自一致性残差引导,利用前一阶段渲染高度图与当前MVS高度图的残差进行约束;3. 置信度双向路由损失,根据可靠性差异化分配几何与外观监督权重。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

SatSurfGS在多个卫星数据集上进行了验证,结果显示其在渲染峰值信噪比(PSNR)和结构相似性(SSIM)指标上均优于现有的通用型基线模型。特别是在表面重建精度方面,该方法显著降低了复杂地形下的几何误差,且在跨数据集测试中表现出极强的泛化鲁棒性,推理速度较传统优化方法有显著提升。

🎯 应用场景

该技术可广泛应用于地理信息系统(GIS)、城市三维建模、灾害评估及国防侦察等领域。在稀疏卫星影像输入下,能够快速生成高精度的数字表面模型(DSM),为城市规划、地形分析及环境监测提供高效、鲁棒的自动化解决方案,具有极高的实际应用价值。

📄 摘要(原文)

Sparse-view satellite image surface reconstruction remains highly challenging, fundamentally because the reliability of multi-view matching under satellite imaging conditions is strongly spatially heterogeneous. Affected by large photometric differences, weak textures, and repetitive textures, multi-view geometric constraints are often sparse, unevenly distributed, and locally unreliable. Although 2D Gaussian Splatting (2DGS) is more suitable than 3D Gaussian Splatting (3DGS) for the explicit representation of continuous surfaces, research on generalizable feed-forward 2DGS frameworks for sparse-view satellite surface reconstruction is still lacking. To address this issue, we propose SatSurfGS, a generalizable sparse-view surface reconstruction method for satellite imagery based on 2DGS. The proposed method builds a coarse-to-fine Gaussian attribute prediction framework and explicitly models local geometric reliability at three levels: feature learning, Gaussian parameter estimation, and training optimization. Specifically, we propose a confidence-aware monocular multi-view feature fusion module to adaptively integrate monocular priors and multi-view matching features according to local confidence; a cross-stage self-consistency residual guidance module to stabilize stage-wise Gaussian parameter refinement using the residual between the rendered height map from the previous stage and the current-stage MVS height map, together with confidence information; and a confidence bidirectional routing loss to achieve differentiated allocation of geometric and appearance supervision. Experiments on satellite datasets show that the proposed method achieves improved rendering quality, surface reconstruction accuracy, cross-dataset generalization, and inference efficiency compared with representative generalizable baselines and competitive per-scene optimization methods.