Closing the Gap Between Synthetic and Ground Truth Time Series Distributions via Neural Mapping

📄 arXiv: 2501.17553v1 📥 PDF

作者: Daesoo Lee, Sara Malacarne, Erlend Aune

分类: cs.LG, stat.ML

发布日期: 2025-01-29

🔗 代码/项目: GITHUB


💡 一句话要点

提出NM-VQTSG以解决向量量化时间序列生成的保真度问题

🎯 匹配领域: 支柱四:生成式动作 (Generative Motion)

关键词: 时间序列生成 向量量化 神经网络 U-Net 数据映射 合成数据 保真度提升

📋 核心要点

  1. 现有的VQ时间序列生成方法在压缩过程中存在信息损失,导致合成数据的保真度和分布准确性不足。
  2. NM-VQTSG通过U-Net结构的神经映射模型,修正生成过程中引入的伪影,从而缩小合成数据与真实数据的分布差距。
  3. 在多个数据集上进行的实验表明,NM-VQTSG在生成任务中显著提高了合成时间序列的质量,尤其在FID和IS指标上表现突出。

📝 摘要(中文)

本文介绍了一种新方法——向量量化时间序列生成的神经映射器(NM-VQTSG),旨在解决向量量化(VQ)时间序列生成中的保真度挑战。现有的VQ方法如TimeVQVAE在生成时间序列时面临两个主要瓶颈:在压缩到离散潜在空间时的信息损失,以及学习的先验分布与真实分布之间的偏差。NM-VQTSG利用基于U-Net的神经映射模型,弥合合成与真实时间序列之间的分布差距,从而有效提高合成数据的质量。我们在UCR时间序列分类档案的多个数据集上评估了NM-VQTSG,结果表明其在无条件和条件生成任务中均能显著提升保真度,且在FID、IS和条件FID等指标上均有显著改善。

🔬 方法详解

问题定义:本文旨在解决向量量化时间序列生成中存在的保真度和分布准确性不足的问题,现有方法在压缩过程中容易导致信息损失和分布偏差。

核心思路:NM-VQTSG的核心思路是利用U-Net结构的神经映射模型,针对合成数据中的伪影进行修正,从而有效对齐合成数据与真实数据的分布。

技术框架:该方法的整体架构包括数据生成阶段和映射修正阶段。首先,使用VQ生成合成时间序列,然后通过U-Net模型对合成数据进行映射修正,以提高其质量。

关键创新:NM-VQTSG的主要创新在于引入了神经映射技术来处理合成数据中的伪影问题,这一方法显著区别于传统的VQ生成方法,能够有效提升合成数据的保真度。

关键设计:在设计上,NM-VQTSG采用了U-Net网络结构,结合特定的损失函数来优化合成数据的质量,确保生成的时间序列在视觉和分布上更接近真实数据。具体的参数设置和网络层次结构在论文中有详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,NM-VQTSG在多个数据集上均显著提升了合成时间序列的质量,FID和IS指标的改善幅度分别达到了XX%和YY%。此外,条件FID的提升也表明该方法在生成任务中的有效性,视觉检查进一步验证了合成数据的质量提升。

🎯 应用场景

该研究的潜在应用领域包括金融市场分析、医疗监测和气候数据预测等需要高质量时间序列数据的场景。NM-VQTSG的技术能够帮助研究人员和工程师生成更真实的合成数据,从而提升模型训练的效果和预测的准确性,具有重要的实际价值和未来影响。

📄 摘要(原文)

In this paper, we introduce Neural Mapper for Vector Quantized Time Series Generator (NM-VQTSG), a novel method aimed at addressing fidelity challenges in vector quantized (VQ) time series generation. VQ-based methods, such as TimeVQVAE, have demonstrated success in generating time series but are hindered by two critical bottlenecks: information loss during compression into discrete latent spaces and deviations in the learned prior distribution from the ground truth distribution. These challenges result in synthetic time series with compromised fidelity and distributional accuracy. To overcome these limitations, NM-VQTSG leverages a U-Net-based neural mapping model to bridge the distributional gap between synthetic and ground truth time series. To be more specific, the model refines synthetic data by addressing artifacts introduced during generation, effectively aligning the distributions of synthetic and real data. Importantly, NM-VQTSG can be used for synthetic time series generated by any VQ-based generative method. We evaluate NM-VQTSG across diverse datasets from the UCR Time Series Classification archive, demonstrating its capability to consistently enhance fidelity in both unconditional and conditional generation tasks. The improvements are evidenced by significant improvements in FID, IS, and conditional FID, additionally backed up by visual inspection in a data space and a latent space. Our findings establish NM-VQTSG as a new method to improve the quality of synthetic time series. Our implementation is available on \url{https://github.com/ML4ITS/TimeVQVAE}.