FACTUAL: A Novel Framework for Contrastive Learning Based Robust SAR Image Classification
作者: Xu Wang, Tian Ye, Rajgopal Kannan, Viktor Prasanna
分类: cs.CV, cs.LG
发布日期: 2024-04-04
备注: 2024 IEEE Radar Conference
💡 一句话要点
提出FACTUAL框架以解决SAR图像分类的对抗性鲁棒性问题
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 合成孔径雷达 对抗训练 深度学习 目标识别 对比学习 鲁棒性 图像分类
📋 核心要点
- 现有的SAR图像分类方法在面对对抗攻击时表现出脆弱性,尤其是对真实世界攻击的适应性不足。
- 本文提出的FACTUAL框架通过引入现实物理对抗攻击的扰动方案,构建了一个监督对抗预训练网络,增强了模型的鲁棒性。
- 实验结果显示,FACTUAL在干净样本上达到99.7%的准确率,在扰动样本上达到89.6%,显著优于现有技术。
📝 摘要(中文)
深度学习模型在合成孔径雷达(SAR)自动目标识别(ATR)中表现出色,但对抗攻击的脆弱性仍然是一个重大挑战。现有研究主要通过对抗样本训练模型以提高鲁棒性,但往往忽视了真实世界攻击的可行性。本文提出了FACTUAL,一个新的对比学习框架,结合了现实物理对抗攻击的扰动方案,构建了监督对抗预训练网络,并通过线性分类器进行目标标签预测。实验结果表明,该模型在干净样本上达到99.7%的准确率,在扰动样本上达到89.6%,均优于现有最先进的方法。
🔬 方法详解
问题定义:本文旨在解决合成孔径雷达(SAR)图像分类中模型对抗攻击的脆弱性。现有方法主要集中于随机扰动,未能有效应对真实世界中的对抗攻击场景。
核心思路:提出FACTUAL框架,通过引入基于现实物理对抗攻击的扰动方案,构建一个监督对抗预训练网络,以增强模型的鲁棒性和分类性能。
技术框架:FACTUAL框架包括两个主要模块:一是采用新型扰动方案的对抗预训练网络,二是一个线性分类器,后者利用编码器计算的特征表示进行目标标签预测。
关键创新:最重要的创新在于引入了现实物理对抗攻击的扰动方案,使得模型在训练过程中能够更好地适应真实世界的对抗攻击,从而显著提高了鲁棒性。
关键设计:在模型设计中,使用了基于类标签的聚类方法,将干净样本和扰动样本聚合到更具信息量的特征空间中,同时采用了适合对抗训练的损失函数,以优化模型的分类性能。
🖼️ 关键图片
📊 实验亮点
实验结果显示,FACTUAL模型在干净样本上达到了99.7%的准确率,而在扰动样本上也取得了89.6%的准确率,均显著优于之前的最先进方法,展示了其在SAR图像分类中的强大鲁棒性。
🎯 应用场景
该研究的潜在应用领域包括军事侦察、无人驾驶汽车、智能监控等需要高鲁棒性的SAR图像分类任务。通过提高模型对对抗攻击的抵抗能力,FACTUAL框架能够在复杂环境中提供更可靠的目标识别,具有重要的实际价值和未来影响。
📄 摘要(原文)
Deep Learning (DL) Models for Synthetic Aperture Radar (SAR) Automatic Target Recognition (ATR), while delivering improved performance, have been shown to be quite vulnerable to adversarial attacks. Existing works improve robustness by training models on adversarial samples. However, by focusing mostly on attacks that manipulate images randomly, they neglect the real-world feasibility of such attacks. In this paper, we propose FACTUAL, a novel Contrastive Learning framework for Adversarial Training and robust SAR classification. FACTUAL consists of two components: (1) Differing from existing works, a novel perturbation scheme that incorporates realistic physical adversarial attacks (such as OTSA) to build a supervised adversarial pre-training network. This network utilizes class labels for clustering clean and perturbed images together into a more informative feature space. (2) A linear classifier cascaded after the encoder to use the computed representations to predict the target labels. By pre-training and fine-tuning our model on both clean and adversarial samples, we show that our model achieves high prediction accuracy on both cases. Our model achieves 99.7% accuracy on clean samples, and 89.6% on perturbed samples, both outperforming previous state-of-the-art methods.