Generalizable and Interpretable RF Fingerprinting with Shapelet-Enhanced Large Language Models

📄 arXiv: 2602.03035v1 📥 PDF

作者: Tianya Zhao, Junqing Zhang, Haowen Xu, Xiaoyan Sun, Jun Dai, Xuyu Wang

分类: cs.CR, cs.LG

发布日期: 2026-02-03

备注: 12 pages, 7 figures, IMWUT submission


💡 一句话要点

提出Shapelet增强的大语言模型框架,实现通用且可解释的射频指纹识别

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 射频指纹识别 领域泛化 可解释性 Shapelet 大语言模型 少样本学习 无线安全

📋 核心要点

  1. 现有基于DNN的射频指纹识别方法泛化能力弱,且模型缺乏可解释性,限制了实际应用。
  2. 提出结合Shapelet和预训练LLM的框架,利用Shapelet提取局部特征,LLM捕获全局信息,提升泛化能力。
  3. 实验结果表明,该方法在多个数据集上,标准和少样本场景下,均优于现有方法,且具有更好的可解释性。

📝 摘要(中文)

深度神经网络(DNNs)在无线设备认证的射频(RF)指纹识别方面取得了显著成功。然而,它们的实际部署面临两个主要限制:领域迁移,即在一个环境中训练的模型难以推广到其他环境;以及DNN的黑盒性质,限制了可解释性。为了解决这些问题,我们提出了一种新颖的框架,该框架将一组变长二维(2D) shapelet与预训练的大语言模型(LLM)集成,以实现高效、可解释和通用的RF指纹识别。2D shapelet显式地捕获同相和正交(I/Q)分量中的各种局部时间模式,提供紧凑且可解释的表示。作为补充,预训练的LLM捕获更长程的依赖关系和全局上下文信息,从而以最小的训练开销实现强大的泛化能力。此外,我们的框架还支持原型生成,用于少样本推理,从而在无需额外重新训练的情况下提高跨域性能。为了评估我们提出的方法的有效性,我们对跨各种协议和领域的六个数据集进行了广泛的实验。结果表明,我们的方法在源域和未见域上都实现了卓越的标准和少样本性能。

🔬 方法详解

问题定义:论文旨在解决射频指纹识别中,深度神经网络模型在面对领域迁移问题时泛化能力不足,以及模型本身缺乏可解释性的问题。现有方法依赖大量数据进行训练,且难以适应新的环境,同时模型内部决策过程不透明,难以信任和调试。

核心思路:论文的核心思路是将传统的Shapelet方法与预训练的大语言模型相结合。Shapelet能够提取信号中的局部特征,具有良好的可解释性。预训练的LLM则能够捕获信号中的长程依赖关系和全局上下文信息,从而提高模型的泛化能力。通过结合两者的优势,可以构建一个既具有良好泛化能力,又具有可解释性的射频指纹识别模型。

技术框架:该框架主要包含两个模块:Shapelet提取模块和LLM分类模块。首先,Shapelet提取模块从I/Q信号中提取一组具有代表性的2D Shapelet特征。这些Shapelet特征能够捕捉信号中的局部时间模式。然后,将提取的Shapelet特征输入到预训练的LLM中进行分类。LLM利用其强大的语言建模能力,学习Shapelet特征之间的关系,并最终输出设备的指纹识别结果。此外,该框架还支持原型生成,用于少样本推理。

关键创新:该论文的关键创新在于将Shapelet方法与预训练的LLM相结合,用于射频指纹识别。与传统的深度学习方法相比,该方法具有更好的泛化能力和可解释性。Shapelet的引入使得模型能够关注信号中的关键局部特征,而LLM则能够利用其强大的语言建模能力,学习特征之间的关系。此外,该方法还支持原型生成,用于少样本推理,进一步提高了模型的泛化能力。

关键设计:Shapelet提取模块采用变长二维Shapelet,以适应不同长度和形状的局部特征。LLM采用预训练的Transformer模型,并进行微调以适应射频指纹识别任务。损失函数采用交叉熵损失函数,用于优化模型的分类性能。原型生成模块采用K-means聚类算法,从每个类别的训练样本中提取具有代表性的原型。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在六个数据集上均取得了优异的性能。在标准设置下,该方法在源域和未见域上均优于现有的深度学习方法。在少样本设置下,该方法通过原型生成,进一步提高了跨域性能,相比现有方法有显著提升。例如,在某个数据集上,该方法相比最佳基线方法,准确率提升了超过5%。

🎯 应用场景

该研究成果可应用于无线设备安全认证、物联网设备管理、无线网络入侵检测等领域。通过对无线设备的射频指纹进行识别,可以有效防止非法设备的接入,提高无线网络的安全性。此外,该技术还可以用于物联网设备的身份认证和管理,确保设备的合法性和安全性。未来,该技术有望在智能家居、智能交通等领域得到广泛应用。

📄 摘要(原文)

Deep neural networks (DNNs) have achieved remarkable success in radio frequency (RF) fingerprinting for wireless device authentication. However, their practical deployment faces two major limitations: domain shift, where models trained in one environment struggle to generalize to others, and the black-box nature of DNNs, which limits interpretability. To address these issues, we propose a novel framework that integrates a group of variable-length two-dimensional (2D) shapelets with a pre-trained large language model (LLM) to achieve efficient, interpretable, and generalizable RF fingerprinting. The 2D shapelets explicitly capture diverse local temporal patterns across the in-phase and quadrature (I/Q) components, providing compact and interpretable representations. Complementarily, the pre-trained LLM captures more long-range dependencies and global contextual information, enabling strong generalization with minimal training overhead. Moreover, our framework also supports prototype generation for few-shot inference, enhancing cross-domain performance without additional retraining. To evaluate the effectiveness of our proposed method, we conduct extensive experiments on six datasets across various protocols and domains. The results show that our method achieves superior standard and few-shot performance across both source and unseen domains.