TFEC: Multivariate Time-Series Clustering via Temporal-Frequency Enhanced Contrastive Learning

📄 arXiv: 2601.07550v1 📥 PDF

作者: Zexi Tan, Tao Xie, Haoyi Xiao, Baoyao Yang, Yuzhu Ji, An Zeng, Xiang Zhang, Yiqun Zhang

分类: cs.LG

发布日期: 2026-01-12

备注: Submitted to ICASSP 2026

🔗 代码/项目: GITHUB


💡 一句话要点

提出TFEC框架,通过时频增强对比学习提升多元时间序列聚类性能

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 多元时间序列聚类 对比学习 时频分析 时间序列表示学习 聚类算法

📋 核心要点

  1. 现有基于对比学习的多元时间序列聚类方法忽略了聚类信息,且数据增强破坏了时间依赖性。
  2. TFEC框架通过时频协同增强机制,在生成低失真表示的同时保留时间结构。
  3. 实验结果表明,TFEC在多个数据集上优于现有方法,平均NMI提升4.48%。

📝 摘要(中文)

多元时间序列(MTS)聚类在信号处理和数据分析中至关重要。深度学习方法,特别是利用对比学习(CL)的方法,在MTS表示学习中表现突出。然而,现有的基于CL的模型面临两个主要限制:1)在正/负样本对构建过程中忽略了聚类信息;2)引入了不合理的归纳偏置,例如,通过增强策略破坏了时间依赖性和周期性,从而损害了表示质量。因此,本文提出了一种时频增强对比(TFEC)学习框架。为了在生成低失真表示的同时保留时间结构,引入了一种时频协同增强(CoEH)机制。相应地,设计了一个协同的双路径表示和聚类分布学习框架,以联合优化聚类结构和表示保真度。在六个真实世界基准数据集上的实验表明了TFEC的优越性,与SOTA方法相比,平均NMI增益达到4.48%,消融研究验证了该设计的有效性。

🔬 方法详解

问题定义:多元时间序列聚类旨在将具有相似时间模式的序列划分到同一簇中。现有基于对比学习的方法在构建正负样本对时,往往忽略了聚类信息,导致学习到的表示与真实的簇结构不一致。此外,常用的数据增强方法,如时间扭曲或幅度缩放,可能会破坏时间序列的时间依赖性和周期性,引入不合理的归纳偏置,从而损害表示质量。

核心思路:TFEC的核心思路是利用时频协同增强(CoEH)机制,在对比学习过程中同时考虑时域和频域的信息,以生成更鲁棒和具有判别性的时间序列表示。通过在时域和频域上进行协同增强,模型能够学习到既保留时间结构又对噪声具有鲁棒性的表示。同时,设计一个双路径学习框架,分别学习表示和聚类分布,并联合优化,从而提高聚类性能。

技术框架:TFEC框架包含两个主要路径:表示学习路径和聚类分布学习路径。表示学习路径利用时频协同增强(CoEH)机制生成增强后的时间序列,并通过对比学习损失来学习时间序列的表示。聚类分布学习路径利用学习到的表示来估计聚类分布,并通过KL散度损失来优化聚类分布。两个路径通过一个共享的编码器进行连接,并联合优化,从而实现表示学习和聚类分布学习的协同优化。

关键创新:TFEC的关键创新在于时频协同增强(CoEH)机制和双路径学习框架。CoEH机制通过在时域和频域上进行协同增强,能够生成既保留时间结构又对噪声具有鲁棒性的时间序列表示。双路径学习框架通过联合优化表示学习和聚类分布学习,能够提高聚类性能。

关键设计:CoEH机制包括时域增强和频域增强两个部分。时域增强采用随机裁剪和时间扭曲等方法,以增加时间序列的多样性。频域增强采用频谱掩码和频谱平滑等方法,以提高时间序列对噪声的鲁棒性。对比学习损失采用InfoNCE损失,以最大化正样本对之间的相似性,最小化负样本对之间的相似性。聚类分布学习采用KL散度损失,以使学习到的聚类分布接近真实的聚类分布。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

TFEC在六个真实世界基准数据集上进行了评估,实验结果表明,TFEC优于现有的SOTA方法,平均NMI增益达到4.48%。消融研究验证了时频协同增强(CoEH)机制和双路径学习框架的有效性。实验结果表明,TFEC能够有效地学习到具有判别性的时间序列表示,并提高聚类性能。

🎯 应用场景

TFEC框架可应用于各种多元时间序列聚类任务,例如:传感器数据分析、金融时间序列分析、医疗健康监测等。通过对时间序列数据进行有效聚类,可以发现隐藏的模式和规律,为决策提供支持,并提高效率。该研究的未来影响在于推动时间序列聚类技术的发展,并促进其在更多领域的应用。

📄 摘要(原文)

Multivariate Time-Series (MTS) clustering is crucial for signal processing and data analysis. Although deep learning approaches, particularly those leveraging Contrastive Learning (CL), are prominent for MTS representation, existing CL-based models face two key limitations: 1) neglecting clustering information during positive/negative sample pair construction, and 2) introducing unreasonable inductive biases, e.g., destroying time dependence and periodicity through augmentation strategies, compromising representation quality. This paper, therefore, proposes a Temporal-Frequency Enhanced Contrastive (TFEC) learning framework. To preserve temporal structure while generating low-distortion representations, a temporal-frequency Co-EnHancement (CoEH) mechanism is introduced. Accordingly, a synergistic dual-path representation and cluster distribution learning framework is designed to jointly optimize cluster structure and representation fidelity. Experiments on six real-world benchmark datasets demonstrate TFEC's superiority, achieving 4.48% average NMI gains over SOTA methods, with ablation studies validating the design. The code of the paper is available at: https://github.com/yueliangy/TFEC.