Source-Free Object Detection with Detection Transformer

作者: Huizai Yao, Sicheng Zhao, Shuo Lu, Hui Chen, Yangyang Li, Guoping Liu, Tengfei Xing, Chenggang Yan, Jianhua Tao, Guiguang Ding

分类: cs.CV, cs.AI

发布日期: 2025-10-13

备注: IEEE Transactions on Image Processing

DOI: 10.1109/TIP.2025.3607621

💡 一句话要点

提出FRANCK框架，通过查询中心特征增强实现DETR的无源域目标检测。

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture)

关键词: 无源域目标检测 DETR 特征重加权 对比学习 特征蒸馏 自训练 领域自适应

📋 核心要点

现有无源域目标检测方法大多局限于Faster R-CNN等传统模型，缺乏对DETR等新型架构的针对性适配。
FRANCK框架通过对象性分数重加权、对比学习、不确定性加权特征蒸馏和动态教师更新等模块，实现DETR的查询中心特征增强。
在多个基准数据集上的实验表明，FRANCK框架达到了最先进的性能，验证了其有效性和与DETR模型的兼容性。

📝 摘要（中文）

本文提出了一种名为Feature Reweighting ANd Contrastive Learning NetworK (FRANCK) 的无源域目标检测 (SFOD) 框架，专门为Detection Transformer (DETR) 执行查询中心特征增强。FRANCK包含四个关键组件：(1) 基于对象性分数的样本重加权 (OSSR) 模块，计算多尺度编码器特征图上的基于注意力的对象性分数，重新加权检测损失以强调较少识别的区域；(2) 具有基于匹配的记忆库的对比学习 (CMMB) 模块，将多级特征集成到记忆库中，增强类对比学习；(3) 不确定性加权查询融合特征蒸馏 (UQFD) 模块，通过预测质量重加权和查询特征融合来改进特征蒸馏；(4) 改进的具有动态教师更新间隔 (DTUI) 的自训练流水线，优化伪标签质量。通过利用这些组件，FRANCK有效地将源预训练的DETR模型适应到目标域，并增强了鲁棒性和泛化能力。在几个广泛使用的基准上的大量实验表明，该方法实现了最先进的性能，突出了其有效性和与基于DETR的SFOD模型的兼容性。

🔬 方法详解

问题定义：无源域目标检测（SFOD）旨在将知识从源域迁移到无监督的目标域，而无需访问源数据。现有的SFOD方法主要集中在Faster R-CNN等传统目标检测模型上，或者被设计为通用解决方案，缺乏对DETR等新型目标检测架构的专门适配。因此，如何有效地将预训练的DETR模型迁移到新的目标域，是本文要解决的核心问题。

核心思路：本文的核心思路是通过查询中心特征增强来提升DETR在目标域上的性能。具体来说，通过一系列模块，包括对象性分数重加权、对比学习、不确定性加权特征蒸馏和动态教师更新，来增强DETR的特征表示能力，从而提高其在目标域上的检测精度和泛化能力。这种设计思路旨在弥补现有SFOD方法在DETR架构上的不足。

技术框架：FRANCK框架主要包含四个关键模块：(1) 对象性分数重加权 (OSSR) 模块：利用注意力机制计算多尺度特征图上的对象性分数，并根据分数调整检测损失，从而关注更难识别的区域。(2) 对比学习与匹配记忆库 (CMMB) 模块：将多层特征整合到记忆库中，增强类间对比学习，提升特征的区分性。(3) 不确定性加权查询融合特征蒸馏 (UQFD) 模块：通过预测质量重加权和查询特征融合，改进特征蒸馏过程，提升模型性能。(4) 动态教师更新间隔 (DTUI) 的自训练流水线：优化伪标签的质量，从而提升自训练的效果。

关键创新：FRANCK框架的关键创新在于其针对DETR架构的查询中心特征增强设计。与现有SFOD方法不同，FRANCK不是简单地将传统方法应用于DETR，而是专门设计了一系列模块来解决DETR在无源域目标检测中面临的挑战。例如，OSSR模块通过对象性分数来关注难识别区域，CMMB模块通过对比学习来增强特征的区分性，UQFD模块通过不确定性加权来提升特征蒸馏的效果。

关键设计：OSSR模块中，对象性分数的计算基于注意力机制，可以有效地捕捉图像中的目标区域。CMMB模块中，记忆库的设计可以存储和利用历史特征信息，从而增强对比学习的效果。UQFD模块中，不确定性权重的计算基于预测结果的置信度，可以有效地过滤掉噪声信息。DTUI模块中，动态调整教师模型的更新间隔，可以平衡伪标签的质量和数量。

🖼️ 关键图片

📊 实验亮点

FRANCK框架在多个广泛使用的基准数据集上取得了最先进的性能，证明了其有效性。具体来说，FRANCK在各种数据集上都显著优于现有的SFOD方法，尤其是在DETR模型上的表现更为突出。这些实验结果表明，FRANCK框架能够有效地将源域知识迁移到目标域，并提升DETR模型的鲁棒性和泛化能力。

🎯 应用场景

该研究成果可应用于各种需要无源域目标检测的场景，例如自动驾驶、智能监控、医学图像分析等。在这些场景中，由于数据隐私、标注成本等原因，无法获取大量的目标域标注数据，因此无源域目标检测技术具有重要的应用价值。该研究可以帮助提升这些应用场景下的目标检测性能，从而提高系统的智能化水平。

📄 摘要（原文）

Source-Free Object Detection (SFOD) enables knowledge transfer from a source domain to an unsupervised target domain for object detection without access to source data. Most existing SFOD approaches are either confined to conventional object detection (OD) models like Faster R-CNN or designed as general solutions without tailored adaptations for novel OD architectures, especially Detection Transformer (DETR). In this paper, we introduce Feature Reweighting ANd Contrastive Learning NetworK (FRANCK), a novel SFOD framework specifically designed to perform query-centric feature enhancement for DETRs. FRANCK comprises four key components: (1) an Objectness Score-based Sample Reweighting (OSSR) module that computes attention-based objectness scores on multi-scale encoder feature maps, reweighting the detection loss to emphasize less-recognized regions; (2) a Contrastive Learning with Matching-based Memory Bank (CMMB) module that integrates multi-level features into memory banks, enhancing class-wise contrastive learning; (3) an Uncertainty-weighted Query-fused Feature Distillation (UQFD) module that improves feature distillation through prediction quality reweighting and query feature fusion; and (4) an improved self-training pipeline with a Dynamic Teacher Updating Interval (DTUI) that optimizes pseudo-label quality. By leveraging these components, FRANCK effectively adapts a source-pre-trained DETR model to a target domain with enhanced robustness and generalization. Extensive experiments on several widely used benchmarks demonstrate that our method achieves state-of-the-art performance, highlighting its effectiveness and compatibility with DETR-based SFOD models.

Source-Free Object Detection with Detection Transformer

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理