Weakly Contrastive Learning via Batch Instance Discrimination and Feature Clustering for Small Sample SAR ATR

📄 arXiv: 2408.03627v1 📥 PDF

作者: Yikui Zhai, Wenlve Zhou, Bing Sun, Jingwen Li, Qirui Ke, Zilu Ying, Junying Gan, Chaoyun Mai, Ruggero Donida Labati, Vincenzo Piuri, Fabio Scotti

分类: cs.CV

发布日期: 2024-08-07

DOI: 10.1109/TGRS.2021.3066195

🔗 代码/项目: GITHUB


💡 一句话要点

提出基于批量实例判别和特征聚类的弱对比学习框架,解决小样本SAR ATR问题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: SAR ATR 小样本学习 对比学习 弱对比学习 特征聚类 动态加权方差损失 深度学习

📋 核心要点

  1. 深度学习在SAR ATR中表现出色,但依赖大量标注数据,小样本场景面临挑战。
  2. 提出BIDFC框架,通过弱对比学习调整样本嵌入距离,适应SAR图像高相似性特点。
  3. 在MSTAR数据集上,仅用3.13%训练数据微调后,分类精度达91.25%,线性评估达90.13%。

📝 摘要(中文)

近年来,深度学习技术在合成孔径雷达(SAR)自动目标识别(ATR)中表现出令人瞩目的性能。然而,该技术需要大量的标注数据,这给通过少量标注数据获得高识别率带来了严峻的挑战。为了克服这个问题,受到对比学习的启发,我们提出了一种名为批量实例判别和特征聚类(BIDFC)的新框架。与一般对比学习方法的目标不同,由于SAR图像中样本之间的高度相似性,样本之间的嵌入距离应该是适中的。因此,我们灵活的框架配备了可调节的嵌入距离,我们称之为弱对比学习。在技术上,在每个批次中,实例标签被分配给未标记的数据,并且对这些增强的数据执行几次随机增强和训练。同时,还提出了一种新的动态加权方差损失(DWV损失)函数,用于聚类每个样本的增强版本的嵌入。在移动和静止目标获取和识别(MSTAR)数据库上的实验结果表明,我们的方法在仅使用3.13%的训练数据进行微调后,分类精度达到91.25%。即使在相同的训练数据上执行线性评估,精度仍然可以达到90.13%。我们还在OpenSarShip数据库中验证了BIDFC的有效性,表明我们的方法可以推广到其他数据集。我们的代码可在https://github.com/Wenlve-Zhou/BIDFC-master上获得。

🔬 方法详解

问题定义:SAR ATR任务中,深度学习模型需要大量标注数据,但在实际应用中,获取大量标注的SAR图像非常困难。现有方法在小样本情况下识别精度较低,难以满足实际需求。因此,该论文旨在解决小样本SAR ATR问题,即在少量标注数据下,提高SAR目标的识别精度。

核心思路:论文的核心思路是利用对比学习的思想,但针对SAR图像的特点进行改进。由于SAR图像中不同类别的目标之间存在较高的相似性,因此传统的对比学习方法可能导致过度的区分,从而降低识别精度。论文提出“弱对比学习”的概念,允许样本之间存在一定的相似性,避免过度区分。

技术框架:BIDFC框架主要包含以下几个阶段:1) 数据增强:对每个批次的未标记数据进行随机增强,生成多个增强版本。2) 实例判别:为每个批次的未标记数据分配实例标签。3) 特征提取:使用深度学习模型提取增强后数据的特征嵌入。4) 弱对比学习:通过调整嵌入距离,实现样本之间的弱对比。5) 特征聚类:使用动态加权方差损失(DWV loss)函数,对每个样本的增强版本的嵌入进行聚类。

关键创新:论文最重要的技术创新点在于提出了“弱对比学习”的概念,并设计了相应的框架来实现。与传统的对比学习方法不同,BIDFC框架允许样本之间存在一定的相似性,更符合SAR图像的特点。此外,DWV损失函数也是一个创新点,它可以有效地对每个样本的增强版本的嵌入进行聚类,提高模型的鲁棒性。

关键设计:DWV损失函数是关键设计之一,其动态调整权重以平衡类内方差和类间距离。具体来说,DWV损失函数的目标是最小化每个样本的增强版本的嵌入之间的方差,同时最大化不同样本之间的距离。此外,论文还采用了随机数据增强策略,以增加数据的多样性,提高模型的泛化能力。批次大小和训练轮数等超参数也需要根据具体数据集进行调整。

📊 实验亮点

在MSTAR数据集上,使用仅3.13%的训练数据进行微调,BIDFC方法达到了91.25%的分类精度,相比于其他对比学习方法有显著提升。即使采用线性评估,精度也能达到90.13%。此外,在OpenSarShip数据集上的实验也验证了BIDFC方法的泛化能力。

🎯 应用场景

该研究成果可应用于军事侦察、灾害监测、海洋监视等领域。在军事侦察中,可以利用少量标注的SAR图像快速识别敌方目标。在灾害监测中,可以利用SAR图像评估灾情,为救援提供支持。在海洋监视中,可以利用SAR图像监测船只,打击非法活动。该研究具有重要的实际应用价值和广阔的应用前景。

📄 摘要(原文)

In recent years, impressive performance of deep learning technology has been recognized in Synthetic Aperture Radar (SAR) Automatic Target Recognition (ATR). Since a large amount of annotated data is required in this technique, it poses a trenchant challenge to the issue of obtaining a high recognition rate through less labeled data. To overcome this problem, inspired by the contrastive learning, we proposed a novel framework named Batch Instance Discrimination and Feature Clustering (BIDFC). In this framework, different from that of the objective of general contrastive learning methods, embedding distance between samples should be moderate because of the high similarity between samples in the SAR images. Consequently, our flexible framework is equipped with adjustable distance between embedding, which we term as weakly contrastive learning. Technically, instance labels are assigned to the unlabeled data in per batch and random augmentation and training are performed few times on these augmented data. Meanwhile, a novel Dynamic-Weighted Variance loss (DWV loss) function is also posed to cluster the embedding of enhanced versions for each sample. Experimental results on the moving and stationary target acquisition and recognition (MSTAR) database indicate a 91.25% classification accuracy of our method fine-tuned on only 3.13% training data. Even though a linear evaluation is performed on the same training data, the accuracy can still reach 90.13%. We also verified the effectiveness of BIDFC in OpenSarShip database, indicating that our method can be generalized to other datasets. Our code is avaliable at: https://github.com/Wenlve-Zhou/BIDFC-master.