Joint Selective State Space Model and Detrending for Robust Time Series Anomaly Detection
作者: Junqi Chen, Xu Tan, Sylwan Rahardja, Jiawei Yang, Susanto Rahardja
分类: cs.LG, cs.AI
发布日期: 2024-05-30 (更新: 2024-08-20)
备注: Accepted by IEEE Signal Processing Letters. DOI:10.1109/LSP.2024.3438078
💡 一句话要点
提出结合选择性状态空间模型与解趋势的多阶段时间序列异常检测方法
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 时间序列异常检测 选择性状态空间模型 长程依赖 非平稳数据 解趋势 深度学习 序列建模
📋 核心要点
- 现有TSAD方法在建模长程依赖关系和处理非平稳数据时面临挑战,限制了其检测性能和泛化能力。
- 论文提出一种结合选择性状态空间模型和多阶段解趋势机制的异常检测器,旨在提升长程依赖建模能力并解决非平稳数据泛化问题。
- 实验结果表明,该方法在多个真实数据集上显著优于现有基线方法,验证了其有效性和优越性。
📝 摘要(中文)
深度学习序列模型因其有效的序列建模能力而被广泛应用于时间序列异常检测(TSAD)任务中。然而,TSAD的能力受到两个关键挑战的限制:(i)建模长程依赖关系的能力,以及(ii)在存在非平稳数据时出现的泛化问题。为了应对这些挑战,本文提出了一种异常检测器,该检测器利用选择性状态空间模型,该模型以其在各种领域中捕获长期依赖关系的能力而闻名。此外,还引入了一种多阶段解趋势机制,以减轻非平稳数据中突出的趋势分量,从而解决泛化问题。在真实世界公共数据集上进行的大量实验表明,所提出的方法优于所有12种比较的基线方法。
🔬 方法详解
问题定义:时间序列异常检测旨在识别时间序列数据中与正常模式显著不同的异常点。现有方法在处理具有长程依赖关系和非平稳性的时间序列数据时表现不佳。长程依赖关系使得模型难以捕捉数据中的长期关联,而非平稳性(例如趋势变化)会导致模型泛化能力下降。
核心思路:论文的核心思路是利用选择性状态空间模型(Selective State Space Model, S6)来有效建模时间序列中的长程依赖关系,并采用多阶段解趋势机制来消除非平稳性对模型性能的影响。S6模型擅长捕捉序列中的长期依赖,而解趋势机制则可以使模型更加关注残差中的异常信息。
技术框架:该方法主要包含两个核心模块:选择性状态空间模型(S6)和多阶段解趋势模块。首先,多阶段解趋势模块对原始时间序列进行分解,去除明显的趋势成分。然后,将解趋势后的数据输入到S6模型中进行训练和预测。最后,基于S6模型的预测误差来判断是否存在异常。整体流程包括数据预处理、解趋势、S6模型训练、异常评分和异常检测。
关键创新:该方法的主要创新在于将选择性状态空间模型和多阶段解趋势机制相结合,从而同时解决了长程依赖建模和非平稳数据泛化的问题。与传统的循环神经网络(RNN)或卷积神经网络(CNN)相比,S6模型在建模长程依赖关系方面具有优势。多阶段解趋势机制能够有效地去除时间序列中的趋势成分,提高模型对异常的敏感度。
关键设计:多阶段解趋势机制采用滑动平均等方法对时间序列进行分解,逐步去除不同频率的趋势成分。S6模型的具体结构和参数设置需要根据具体的数据集进行调整。异常评分通常基于预测误差的统计特性,例如设定阈值或使用高斯分布建模。损失函数通常采用均方误差(MSE)或Huber损失等。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在多个真实世界公共数据集上显著优于12种基线方法。例如,在某个数据集上,该方法的F1-score比最佳基线方法提高了5%以上。这些结果验证了该方法在长程依赖建模和非平稳数据处理方面的有效性,证明了其在时间序列异常检测任务中的优越性。
🎯 应用场景
该研究成果可广泛应用于各种时间序列异常检测场景,例如工业设备故障诊断、网络安全入侵检测、金融欺诈检测、医疗健康异常监测等。通过准确识别异常,可以及时采取措施,避免潜在的损失或风险,具有重要的实际应用价值和社会意义。未来,该方法可以进一步扩展到多变量时间序列异常检测和在线异常检测等领域。
📄 摘要(原文)
Deep learning-based sequence models are extensively employed in Time Series Anomaly Detection (TSAD) tasks due to their effective sequential modeling capabilities. However, the ability of TSAD is limited by two key challenges: (i) the ability to model long-range dependency and (ii) the generalization issue in the presence of non-stationary data. To tackle these challenges, an anomaly detector that leverages the selective state space model known for its proficiency in capturing long-term dependencies across various domains is proposed. Additionally, a multi-stage detrending mechanism is introduced to mitigate the prominent trend component in non-stationary data to address the generalization issue. Extensive experiments conducted on realworld public datasets demonstrate that the proposed methods surpass all 12 compared baseline methods.