Diffusion-Driven Progressive Target Manipulation for Source-Free Domain Adaptation

作者: Yuyang Huang, Yabo Chen, Junyu Zhou, Wenrui Dai, Xiaopeng Zhang, Junni Zou, Hongkai Xiong, Qi Tian

分类: cs.CV

发布日期: 2025-10-29

备注: Accepted by NeurIPS 2025

💡 一句话要点

提出扩散驱动的渐进式目标域操控方法，解决无源域自适应中的域差异问题。

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 无源域自适应 领域自适应 扩散模型 伪标签 目标域操控

📋 核心要点

现有无源域自适应方法在处理源域和目标域差异较大时，伪标签质量差或生成伪数据引入更大差异。
提出扩散驱动的渐进式目标域操控方法，利用扩散模型生成并逐步优化伪目标域，缩小域差异。
实验表明，该方法在多个数据集上显著优于现有方法，尤其在域差异大的情况下性能提升显著。

📝 摘要（中文）

无源域自适应(SFDA)是一项具有挑战性的任务，它仅使用预训练的源模型和无标签的目标数据来解决域偏移问题。现有的SFDA方法受到源域和目标域差异的基本限制。非生成式SFDA方法在具有较大域差异的挑战性场景中，会受到不可靠的伪标签的影响，而基于生成的SFDA方法由于在创建伪源数据时扩大了域差异而明显退化。为了解决这个限制，我们提出了一种新的基于生成的框架，名为扩散驱动的渐进式目标域操控(DPTM)，该框架利用无标签的目标数据作为参考，以可靠地生成和逐步细化伪目标域，用于SFDA。具体来说，我们根据伪标签的可靠性将目标样本分为信任集和非信任集，以充分且可靠地利用它们的信息。对于来自非信任集的样本，我们开发了一种操控策略，以语义方式将它们转换为新分配的类别，同时通过潜在扩散模型将它们保持在目标分布中。此外，我们设计了一种渐进式细化机制，通过迭代细化逐步减少伪目标域和真实目标域之间的域差异。实验结果表明，DPTM优于现有方法，并在具有不同规模的四个主流SFDA基准数据集上实现了最先进的性能。值得注意的是，DPTM可以在源域和目标域差距较大的情况下显著提高性能，最高可达18.6%。

🔬 方法详解

问题定义：无源域自适应(SFDA)旨在仅利用预训练的源域模型和无标签的目标域数据，将知识迁移到目标域。现有方法在处理源域和目标域差异较大时面临挑战。非生成式方法依赖伪标签，但域差异导致伪标签质量下降。生成式方法尝试生成伪源域数据，但生成过程可能进一步扩大域差异，导致性能下降。

核心思路：本文的核心思路是利用扩散模型，以目标域数据为参考，生成并逐步优化伪目标域数据。通过将不可靠的目标域样本转换到新的类别，并使用扩散模型保持其目标域分布，从而创建一个更接近真实目标域的伪目标域。渐进式细化机制进一步缩小伪目标域和真实目标域之间的差距。

技术框架：DPTM框架包含以下主要模块：1) 信任集和非信任集划分模块：根据伪标签的置信度将目标域样本划分为信任集和非信任集。2) 扩散驱动的目标域操控模块：对于非信任集样本，使用扩散模型将其语义转换为新的类别，同时保持其目标域分布。3) 渐进式细化模块：通过迭代细化，逐步缩小伪目标域和真实目标域之间的域差异。

关键创新：该方法最重要的创新点在于利用扩散模型进行目标域操控，能够在语义转换的同时保持目标域分布，避免了传统生成方法可能引入的域差异扩大问题。此外，渐进式细化机制进一步提升了伪目标域的质量。

关键设计：关键设计包括：1) 信任集和非信任集的划分标准，例如使用伪标签的置信度阈值。2) 扩散模型的选择和训练，需要保证生成样本的多样性和真实性。3) 渐进式细化机制的迭代次数和学习率等参数设置。4) 损失函数的设计，例如使用交叉熵损失和域对抗损失等。

📊 实验亮点

实验结果表明，DPTM在四个主流SFDA基准数据集上取得了state-of-the-art的性能。尤其是在源域和目标域差距较大的情况下，DPTM的性能提升显著，最高可达18.6%。这表明该方法能够有效解决域差异带来的挑战，具有很强的鲁棒性和泛化能力。

🎯 应用场景

该研究成果可应用于各种无源域自适应场景，例如：医学图像分析、自动驾驶、机器人导航等。在这些场景中，获取大量标注的目标域数据成本高昂，而该方法能够有效利用已有的源域知识和无标注的目标域数据，提升模型在目标域的性能，具有重要的实际应用价值和潜力。

📄 摘要（原文）

Source-free domain adaptation (SFDA) is a challenging task that tackles domain shifts using only a pre-trained source model and unlabeled target data. Existing SFDA methods are restricted by the fundamental limitation of source-target domain discrepancy. Non-generation SFDA methods suffer from unreliable pseudo-labels in challenging scenarios with large domain discrepancies, while generation-based SFDA methods are evidently degraded due to enlarged domain discrepancies in creating pseudo-source data. To address this limitation, we propose a novel generation-based framework named Diffusion-Driven Progressive Target Manipulation (DPTM) that leverages unlabeled target data as references to reliably generate and progressively refine a pseudo-target domain for SFDA. Specifically, we divide the target samples into a trust set and a non-trust set based on the reliability of pseudo-labels to sufficiently and reliably exploit their information. For samples from the non-trust set, we develop a manipulation strategy to semantically transform them into the newly assigned categories, while simultaneously maintaining them in the target distribution via a latent diffusion model. Furthermore, we design a progressive refinement mechanism that progressively reduces the domain discrepancy between the pseudo-target domain and the real target domain via iterative refinement. Experimental results demonstrate that DPTM outperforms existing methods by a large margin and achieves state-of-the-art performance on four prevailing SFDA benchmark datasets with different scales. Remarkably, DPTM can significantly enhance the performance by up to 18.6% in scenarios with large source-target gaps.

Diffusion-Driven Progressive Target Manipulation for Source-Free Domain Adaptation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册