Domain Generalization for Semantic Segmentation: A Survey

📄 arXiv: 2510.03540v1 📥 PDF

作者: Manuel Schwonberg, Hanno Gottschalk

分类: cs.CV

发布日期: 2025-10-03

备注: Accepted to CVPR2025W


💡 一句话要点

领域泛化语义分割综述:分析现有方法并展望基于预训练模型的新方向

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 领域泛化 语义分割 深度学习 预训练模型 综述

📋 核心要点

  1. 深度神经网络在未知领域泛化能力不足,限制了其在语义分割等实际应用中的效果。
  2. 领域泛化旨在利用多个源域数据训练模型,使其能够泛化到未知的目标领域,无需目标域数据。
  3. 综述分析了现有领域泛化语义分割方法,并着重强调了基于预训练模型的领域泛化方法的重要性。

📝 摘要(中文)

深度神经网络近年来取得了显著进展,但其在未知领域中的泛化能力仍然是一个主要挑战。因此,领域泛化(DG)这一活跃领域应运而生。与无监督领域自适应不同,领域泛化方法无法访问或了解目标领域的信息,旨在跨多个不同的、未见过的目标领域进行泛化。领域泛化与语义分割任务尤为相关,语义分割被广泛应用于生物医学或自动驾驶等领域。本综述全面概述了快速发展的领域泛化语义分割主题。我们对现有方法进行聚类和回顾,并识别出向基于预训练模型的领域泛化范式的转变。最后,我们对所有方法的性能进行了广泛的比较,突出了预训练模型对领域泛化的显著影响。本综述旨在推进领域泛化研究,并激励科学家探索新的研究方向。

🔬 方法详解

问题定义:领域泛化语义分割旨在解决模型在训练数据(源域)和测试数据(目标域)分布不一致时,分割性能显著下降的问题。现有的方法通常依赖于特定领域的知识或假设,难以泛化到完全未知的目标领域。此外,许多方法在设计时没有充分利用大规模预训练模型的潜力,导致性能提升有限。

核心思路:本综述的核心思路是对现有领域泛化语义分割方法进行系统性的分类和分析,并着重关注基于预训练模型的最新进展。通过对不同方法的性能进行比较,揭示了预训练模型在提升领域泛化能力方面的关键作用。同时,也指出了现有方法的局限性,为未来的研究方向提供了指导。

技术框架:该综述没有提出新的技术框架,而是对现有方法进行了梳理和总结。主要的技术框架可以分为以下几类:1) 基于数据增强的方法,通过生成新的训练数据来扩大源域的分布;2) 基于领域不变特征学习的方法,旨在学习与领域无关的特征表示;3) 基于元学习的方法,通过模拟领域迁移的过程来提高模型的泛化能力;4) 基于预训练模型的方法,利用大规模预训练模型提取的通用特征来提升分割性能。

关键创新:该综述的关键创新在于对领域泛化语义分割领域进行了全面的回顾和分析,特别是强调了预训练模型在该领域中的重要性。通过对现有方法的性能进行比较,揭示了预训练模型在提升领域泛化能力方面的显著优势。

关键设计:由于是综述文章,没有具体的技术细节。但文章强调了预训练模型在领域泛化中的作用,因此,如何有效地利用预训练模型的特征,以及如何设计合适的微调策略,是未来研究的关键方向。例如,可以探索不同的预训练模型架构、不同的微调策略、以及不同的损失函数等。

📊 实验亮点

该综述通过对现有方法的性能进行比较,突出了预训练模型对领域泛化的显著影响。实验结果表明,基于预训练模型的领域泛化方法通常能够取得更好的性能,尤其是在目标领域与源领域差异较大的情况下。这表明预训练模型能够提供更通用的特征表示,从而提高模型的泛化能力。

🎯 应用场景

领域泛化语义分割技术在许多领域具有广泛的应用前景,例如自动驾驶、医学图像分析、遥感图像处理等。在自动驾驶领域,该技术可以提高车辆在不同天气、光照条件下的感知能力。在医学图像分析领域,可以帮助医生更准确地诊断疾病。在遥感图像处理领域,可以用于土地利用分类、灾害监测等。

📄 摘要(原文)

The generalization of deep neural networks to unknown domains is a major challenge despite their tremendous progress in recent years. For this reason, the dynamic area of domain generalization (DG) has emerged. In contrast to unsupervised domain adaptation, there is no access to or knowledge about the target domains, and DG methods aim to generalize across multiple different unseen target domains. Domain generalization is particularly relevant for the task semantic segmentation which is used in several areas such as biomedicine or automated driving. This survey provides a comprehensive overview of the rapidly evolving topic of domain generalized semantic segmentation. We cluster and review existing approaches and identify the paradigm shift towards foundation-model-based domain generalization. Finally, we provide an extensive performance comparison of all approaches, which highlights the significant influence of foundation models on domain generalization. This survey seeks to advance domain generalization research and inspire scientists to explore new research directions.