FCL-COD: Weakly Supervised Camouflaged Object Detection with Frequency-aware and Contrastive Learning

📄 arXiv: 2603.22969v1 📥 PDF

作者: Jingchen Ni, Quan Zhang, Dan Jiang, Keyu Lv, Ke Zhang, Chun Yuan

分类: cs.CV

发布日期: 2026-03-24

备注: CVPR 2026 Findings


💡 一句话要点

提出FCL-COD框架,通过频率感知和对比学习解决弱监督伪装目标检测难题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 伪装目标检测 弱监督学习 频率感知 对比学习 低秩自适应

📋 核心要点

  1. 现有弱监督伪装目标检测方法性能不佳,且SAM模型难以处理非伪装目标响应和边界模糊等问题。
  2. 提出FCL-COD框架,通过频率感知低秩自适应、梯度感知对比学习和多尺度频率感知表示学习来解决上述问题。
  3. 在三个COD基准数据集上验证,FCL-COD超越了现有最先进的弱监督和全监督方法。

📝 摘要(中文)

现有的伪装目标检测(COD)方法通常依赖于由掩码标注指导的全监督学习。然而,获取掩码标注既耗时又费力。与全监督方法相比,现有的弱监督COD方法表现出明显较差的性能。即使对于Segment Anything Model(SAM),在处理弱监督伪装目标检测(WSCOD)时仍然存在挑战,例如:a.非伪装目标响应,b.局部响应,c.极端响应,以及d.缺乏精细的边界感知,这导致在伪装场景中产生不令人满意的结果。为了缓解这些问题,本文提出了一种基于频率感知和对比学习的WSCOD框架,名为FCL-COD。为了减轻非伪装目标响应的问题,我们提出了频率感知低秩自适应(FoRA)方法,该方法将频率感知的伪装场景知识融入SAM。为了克服局部和极端响应的挑战,我们引入了一种梯度感知对比学习方法,该方法有效地描绘了精确的前景-背景边界。此外,为了解决缺乏精细边界感知的问题,我们提出了一种多尺度频率感知表示学习策略,该策略有助于建模更精细的边界。我们通过在三个广泛认可的COD基准上进行的大量经验实验验证了我们方法的有效性。结果证实,我们的方法超越了最先进的弱监督甚至全监督技术。

🔬 方法详解

问题定义:论文旨在解决弱监督伪装目标检测(WSCOD)问题。现有方法的痛点在于依赖大量人工标注,成本高昂。即使是强大的SAM模型,在WSCOD任务中也会出现非伪装目标响应、局部响应、极端响应以及边界感知不足等问题,导致检测精度不高。

核心思路:论文的核心思路是利用频率域信息和对比学习来提升WSCOD的性能。通过频率感知模块关注伪装目标的特性,利用对比学习区分前景和背景,从而克服现有方法的局限性。这种设计旨在充分利用图像的内在信息,减少对人工标注的依赖。

技术框架:FCL-COD框架主要包含三个核心模块:1) 频率感知低秩自适应(FoRA):将频率感知的伪装场景知识融入SAM,抑制非伪装目标响应。2) 梯度感知对比学习:通过梯度信息引导对比学习,更精确地划分前景和背景边界,克服局部和极端响应。3) 多尺度频率感知表示学习:利用多尺度信息和频率域特征,学习更精细的边界表示。整体流程是先通过FoRA对SAM进行适应,然后利用梯度感知对比学习和多尺度频率感知表示学习进行优化,最终得到伪装目标的检测结果。

关键创新:论文的关键创新在于将频率域信息和对比学习有效结合,用于解决WSCOD问题。FoRA模块将频率信息融入SAM,使其更关注伪装目标的特性。梯度感知对比学习则利用梯度信息引导对比学习,提高了边界的区分能力。多尺度频率感知表示学习则进一步增强了边界的精细化建模能力。与现有方法相比,FCL-COD更有效地利用了图像的内在信息,减少了对人工标注的依赖。

关键设计:FoRA模块的具体实现方式是使用低秩自适应方法,将频率域的先验知识融入SAM的参数中。梯度感知对比学习的损失函数设计为基于梯度的对比损失,鼓励模型学习区分前景和背景的特征表示。多尺度频率感知表示学习则通过不同尺度的卷积操作提取多尺度特征,并利用频率域变换增强边界信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,FCL-COD在三个广泛使用的COD基准数据集上均取得了显著的性能提升,超越了现有的弱监督和全监督方法。具体而言,FCL-COD在S-measure、E-measure和F-measure等指标上均取得了领先水平,证明了其在弱监督伪装目标检测方面的有效性。

🎯 应用场景

该研究成果可应用于智能安防、医学图像分析、遥感图像处理等领域。例如,在智能安防中,可以用于检测隐藏在复杂环境中的可疑目标;在医学图像分析中,可以辅助医生识别难以察觉的病灶;在遥感图像处理中,可以用于识别伪装的军事目标或自然灾害。

📄 摘要(原文)

Existing camouflage object detection (COD) methods typically rely on fully-supervised learning guided by mask annotations. However, obtaining mask annotations is time-consuming and labor-intensive. Compared to fully-supervised methods, existing weakly-supervised COD methods exhibit significantly poorer performance. Even for the Segment Anything Model (SAM), there are still challenges in handling weakly-supervised camouflage object detection (WSCOD), such as: a. non-camouflage target responses, b. local responses, c. extreme responses, and d. lack of refined boundary awareness, which leads to unsatisfactory results in camouflage scenes. To alleviate these issues, we propose a frequency-aware and contrastive learning-based WSCOD framework in this paper, named FCL-COD. To mitigate the problem of non-camouflaged object responses, we propose the Frequency-aware Low-rank Adaptation (FoRA) method, which incorporates frequency-aware camouflage scene knowledge into SAM. To overcome the challenges of local and extreme responses, we introduce a gradient-aware contrastive learning approach that effectively delineates precise foreground-background boundaries. Additionally, to address the lack of refined boundary perception, we present a multi-scale frequency-aware representation learning strategy that facilitates the modeling of more refined boundaries. We validate the effectiveness of our approach through extensive empirical experiments on three widely recognized COD benchmarks. The results confirm that our method surpasses both state-of-the-art weakly supervised and even fully supervised techniques.