A New Spatiotemporal Correlation Anomaly Detection Method that Integrates Contrastive Learning and Few-Shot Learning in Wireless Sensor Networks
作者: Miao Ye, Suxiao Wang, Jiaguang Han, Yong Wang, Xiaoli Wang, Jingxuan Wei, Peng Wen, Jing Cui
分类: cs.LG, cs.AI
发布日期: 2025-05-31
💡 一句话要点
提出MTAD-RD模型,解决无线传感器网络时空异常检测中特征提取和样本不平衡问题
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)
关键词: 无线传感器网络 异常检测 时空相关性 对比学习 少样本学习 图注意力网络 时间序列分析
📋 核心要点
- 现有WSN异常检测方法在时空特征提取、无标签数据处理、少样本异常和样本不平衡问题上存在不足。
- MTAD-RD模型通过RetNet、多粒度特征融合和图注意力网络提取时空特征,并采用对比学习和少样本学习解决标签缺失和样本不平衡问题。
- 在真实数据集上的实验表明,MTAD-RD模型的F1分数达到了90.97%,优于现有的监督异常检测方法。
📝 摘要(中文)
本文提出了一种新的时空相关异常检测方法MTAD-RD,该方法集成了对比学习和少样本学习,用于无线传感器网络(WSN)。现有WSN异常检测方法在时空相关特征提取、无标签样本处理、少异常样本和样本不平衡等方面面临挑战。MTAD-RD模型从模型架构和两阶段训练策略出发,其骨干网络包括一个由交叉保持(CR)模块增强的保持网络(RetNet)、一个多粒度特征融合模块和一个图注意力网络模块,用于提取节点间相关信息。该模型集成了WSN邻居节点间的模态相关特征和空间特征,同时提取时间序列数据的全局信息,并且其序列化推理特性显著降低了推理开销。在模型训练方面,设计了两阶段训练方法。首先,为WSN中具有图结构信息的时间序列数据设计了对比学习代理任务,使骨干网络能够使用无监督对比学习方法从无标签数据中学习可迁移特征,从而解决数据集中缺少样本标签的问题。然后,设计了一种基于缓存的样本采样器,将样本划分为少样本和对比学习数据。开发了一种特定的联合损失函数,用于联合训练双图判别器网络,以有效解决样本不平衡问题。在真实公共数据集上进行的实验表明,所设计的MTAD-RD异常检测方法实现了90.97%的F1分数,优于现有的监督WSN异常检测方法。
🔬 方法详解
问题定义:论文旨在解决无线传感器网络(WSN)中异常检测的问题。现有方法难以充分提取时空相关特征,无法有效处理无标签样本,且在异常样本稀少和样本分布不平衡的情况下表现不佳。这些问题限制了WSN异常检测的准确性和可靠性。
核心思路:论文的核心思路是结合对比学习和少样本学习,设计一个能够有效提取时空特征并处理样本不平衡问题的异常检测模型。通过对比学习从未标记数据中学习可迁移的特征,并通过少样本学习提高模型在少量异常样本下的检测能力。
技术框架:MTAD-RD模型包含以下主要模块:1) 由交叉保持(CR)模块增强的保持网络(RetNet),用于提取时间序列的全局信息;2) 多粒度特征融合模块,用于融合不同粒度的特征;3) 图注意力网络模块,用于提取节点间的空间相关信息。模型采用两阶段训练策略:第一阶段使用对比学习进行预训练,第二阶段使用少样本学习进行微调。
关键创新:该方法的主要创新点在于:1) 提出了一个集成了RetNet、多粒度特征融合和图注意力网络的MTAD-RD模型,能够有效提取时空相关特征;2) 设计了一种基于对比学习的预训练方法,能够从未标记数据中学习可迁移的特征;3) 提出了一种基于缓存的样本采样器和联合损失函数,能够有效解决样本不平衡问题。
关键设计:RetNet通过交叉保持(CR)模块增强,提升了对时间序列全局信息的捕捉能力。多粒度特征融合模块融合了不同时间尺度的特征,提高了模型的鲁棒性。图注意力网络模块利用节点间的空间关系,提升了异常检测的准确性。对比学习的代理任务旨在最大化相似样本之间的相似度,最小化不同样本之间的相似度。联合损失函数结合了对比学习损失和少样本学习损失,平衡了模型的学习目标。
📊 实验亮点
MTAD-RD模型在真实公共数据集上进行了实验,结果表明其F1分数达到了90.97%,显著优于现有的监督WSN异常检测方法。这一结果验证了该模型在时空特征提取和样本不平衡处理方面的有效性,为WSN异常检测领域的研究提供了新的思路。
🎯 应用场景
该研究成果可应用于各种需要实时监控和异常检测的无线传感器网络,例如环境监测、智能农业、工业自动化和智能交通等领域。通过及时发现网络中的异常行为,可以提高系统的可靠性和稳定性,并为决策提供重要依据,具有重要的实际应用价值和潜在的社会经济效益。
📄 摘要(原文)
Detecting anomalies in the data collected by WSNs can provide crucial evidence for assessing the reliability and stability of WSNs. Existing methods for WSN anomaly detection often face challenges such as the limited extraction of spatiotemporal correlation features, the absence of sample labels, few anomaly samples, and an imbalanced sample distribution. To address these issues, a spatiotemporal correlation detection model (MTAD-RD) considering both model architecture and a two-stage training strategy perspective is proposed. In terms of model structure design, the proposed MTAD-RD backbone network includes a retentive network (RetNet) enhanced by a cross-retention (CR) module, a multigranular feature fusion module, and a graph attention network module to extract internode correlation information. This proposed model can integrate the intermodal correlation features and spatial features of WSN neighbor nodes while extracting global information from time series data. Moreover, its serialized inference characteristic can remarkably reduce inference overhead. For model training, a two-stage training approach was designed. First, a contrastive learning proxy task was designed for time series data with graph structure information in WSNs, enabling the backbone network to learn transferable features from unlabeled data using unsupervised contrastive learning methods, thereby addressing the issue of missing sample labels in the dataset. Then, a caching-based sample sampler was designed to divide samples into few-shot and contrastive learning data. A specific joint loss function was developed to jointly train the dual-graph discriminator network to address the problem of sample imbalance effectively. In experiments carried out on real public datasets, the designed MTAD-RD anomaly detection method achieved an F1 score of 90.97%, outperforming existing supervised WSN anomaly detection methods.