TimeMar: Multi-Scale Autoregressive Modeling for Unconditional Time Series Generation

📄 arXiv: 2601.11184v1 📥 PDF

作者: Xiangyu Xu, Qingsong Zhong, Jilin Hu

分类: cs.LG

发布日期: 2026-01-16


💡 一句话要点

TimeMar:提出一种多尺度自回归模型用于无条件时间序列生成。

🎯 匹配领域: 支柱四:生成式动作 (Generative Motion)

关键词: 时间序列生成 多尺度建模 自回归模型 VQ-VAE 结构解耦 长期序列 无条件生成

📋 核心要点

  1. 现有时间序列生成模型难以充分捕捉时间序列的多尺度时间模式和异构成分等结构复杂性。
  2. 提出一种结构解耦的多尺度生成框架,通过多尺度离散token和由粗到精的自回归生成来保留分层依赖关系。
  3. 实验表明,该方法在多个数据集上生成了更高质量的时间序列,且参数量更少,尤其擅长生成高质量的长期序列。

📝 摘要(中文)

生成模型为时间序列分析中的数据稀缺和隐私挑战提供了一个有前景的解决方案。然而,时间序列的结构复杂性,其特征在于多尺度时间模式和异构成分,尚未得到充分解决。本文提出了一种用于时间序列的结构解耦多尺度生成框架。我们的方法将序列编码为多个时间分辨率的离散token,并以由粗到精的方式执行自回归生成,从而保留分层依赖关系。为了解决结构异质性,我们引入了一种双路径VQ-VAE,它可以解耦趋势和季节性成分,从而能够学习语义一致的潜在表示。此外,我们提出了一种基于指导的重建策略,其中粗略的季节性信号被用作先验来指导细粒度季节性模式的重建。在六个数据集上的实验表明,我们的方法比现有方法产生更高质量的时间序列。值得注意的是,我们的模型以显著减少的参数数量实现了强大的性能,并且在生成高质量长期序列方面表现出卓越的能力。

🔬 方法详解

问题定义:现有的时间序列生成模型难以有效处理时间序列数据中固有的多尺度时间模式和异构成分。这些模型通常无法充分捕捉长期依赖关系,并且在处理具有不同趋势和季节性特征的序列时表现不佳。因此,生成的时间序列质量不高,无法满足实际应用的需求。

核心思路:论文的核心思路是将时间序列分解为不同时间尺度上的离散token,并利用自回归模型以由粗到精的方式生成这些token。通过这种方式,模型可以更好地捕捉时间序列中的分层依赖关系。此外,使用双路径VQ-VAE来解耦趋势和季节性成分,从而学习到更具语义一致性的潜在表示,提高生成质量。

技术框架:TimeMar的整体框架包含以下几个主要模块:1) 多尺度编码器:将输入时间序列编码为多个时间分辨率的离散token。2) 双路径VQ-VAE:用于解耦趋势和季节性成分,并学习相应的潜在表示。3) 自回归生成器:以由粗到精的方式生成离散token,从而生成时间序列。4) 基于指导的重建模块:利用粗略的季节性信号作为先验,指导细粒度季节性模式的重建。

关键创新:该论文的关键创新在于结构解耦的多尺度生成框架,它能够有效地捕捉时间序列中的多尺度时间模式和异构成分。双路径VQ-VAE的设计是另一个创新点,它能够解耦趋势和季节性成分,从而学习到更具语义一致性的潜在表示。此外,基于指导的重建策略也提高了生成时间序列的质量。

关键设计:多尺度编码器使用不同大小的卷积核来提取不同时间尺度上的特征。双路径VQ-VAE包含两个独立的VQ-VAE,分别用于编码趋势和季节性成分。自回归生成器使用Transformer架构,并以由粗到精的方式生成离散token。基于指导的重建模块使用注意力机制来融合粗略的季节性信号和细粒度特征。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

TimeMar在六个数据集上进行了实验,结果表明其生成的时间序列质量优于现有方法。尤其值得注意的是,该模型在参数量显著减少的情况下,仍然取得了强大的性能,并且在生成高质量长期序列方面表现出卓越的能力。具体性能提升数据和对比基线在论文中进行了详细展示。

🎯 应用场景

该研究成果可广泛应用于各种时间序列数据的生成任务,例如金融市场数据模拟、电力负荷预测、医疗健康数据合成等。通过生成高质量的时间序列数据,可以有效解决数据稀缺和隐私保护问题,促进相关领域的研究和应用。此外,该模型在长期序列生成方面的优势使其在需要预测未来趋势的场景中具有重要价值。

📄 摘要(原文)

Generative modeling offers a promising solution to data scarcity and privacy challenges in time series analysis. However, the structural complexity of time series, characterized by multi-scale temporal patterns and heterogeneous components, remains insufficiently addressed. In this work, we propose a structure-disentangled multiscale generation framework for time series. Our approach encodes sequences into discrete tokens at multiple temporal resolutions and performs autoregressive generation in a coarse-to-fine manner, thereby preserving hierarchical dependencies. To tackle structural heterogeneity, we introduce a dual-path VQ-VAE that disentangles trend and seasonal components, enabling the learning of semantically consistent latent representations. Additionally, we present a guidance-based reconstruction strategy, where coarse seasonal signals are utilized as priors to guide the reconstruction of fine-grained seasonal patterns. Experiments on six datasets show that our approach produces higher-quality time series than existing methods. Notably, our model achieves strong performance with a significantly reduced parameter count and exhibits superior capability in generating high-quality long-term sequences. Our implementation is available at https://anonymous.4open.science/r/TimeMAR-BC5B.