ChronoGraph: A Real-World Graph-Based Multivariate Time Series Dataset

📄 arXiv: 2509.04449v3 📥 PDF

作者: Adrian Catalin Lutu, Ioana Pintilie, Elena Burceanu, Andrei Manolache

分类: cs.LG, cs.AI

发布日期: 2025-09-04 (更新: 2025-11-27)

备注: Accepted as an oral presentation at the NeurIPS 2025 Workshop on Recent Advances in Time Series Foundation Models (BERT2S)


💡 一句话要点

ChronoGraph:一个基于真实微服务系统的图结构多元时间序列数据集

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多元时间序列 图神经网络 异常检测 微服务系统 结构感知预测

📋 核心要点

  1. 现有时间序列数据集缺乏真实微服务系统的复杂依赖关系,难以评估结构感知预测方法。
  2. ChronoGraph通过构建基于真实微服务系统的图结构数据集,显式编码服务依赖关系,提供多元时间序列和异常标签。
  3. 该数据集包含基线预测和异常检测结果,为结构感知预测和事件感知评估提供了一个现实的基准。

📝 摘要(中文)

本文提出了ChronoGraph,一个基于真实生产微服务构建的图结构多元时间序列预测数据集。每个节点代表一个服务,它发出包含CPU、内存和网络使用模式的多元系统级性能指标流;有向边编码服务之间的依赖关系。主要任务是预测服务级别的这些信号的未来值。此外,ChronoGraph还提供了专家标注的事件窗口作为异常标签,从而能够评估异常检测方法并评估运营中断期间预测的鲁棒性。与来自工业控制系统或交通和空气质量领域的现有基准相比,ChronoGraph独特地结合了(i)多元时间序列,(ii)显式的、机器可读的依赖图,以及(iii)与真实事件对齐的异常标签。我们报告了涵盖预测模型、预训练时间序列基础模型和标准异常检测器的基线结果。ChronoGraph为研究微服务系统中的结构感知预测和事件感知评估提供了一个真实的基准。

🔬 方法详解

问题定义:论文旨在提供一个更贴近真实生产环境的多元时间序列数据集,用于评估和提升时间序列预测和异常检测算法在微服务系统中的性能。现有数据集通常缺乏真实系统中的复杂依赖关系,难以评估结构感知的预测方法,并且缺乏与真实事件相关的异常标签。

核心思路:论文的核心思路是利用真实生产微服务系统的监控数据,构建一个图结构的数据集,其中节点代表服务,边代表服务之间的依赖关系。通过这种方式,可以显式地建模服务之间的交互,并利用图结构信息来提升预测和异常检测的性能。同时,提供专家标注的事件窗口作为异常标签,使得可以评估算法在真实运营中断期间的鲁棒性。

技术框架:ChronoGraph数据集的构建流程主要包括以下几个步骤:1) 从真实生产微服务系统中收集系统级性能指标,例如CPU、内存和网络使用情况;2) 构建服务依赖图,其中节点代表服务,有向边代表服务之间的依赖关系;3) 对时间序列数据进行预处理,例如缺失值填充和异常值处理;4) 专家人工标注事件窗口作为异常标签,与真实事件对齐;5) 提供基线预测和异常检测结果,方便研究人员进行比较和评估。

关键创新:ChronoGraph数据集的关键创新在于其真实性和复杂性。它不同于以往的合成数据集或来自其他领域的数据集,而是直接从真实生产微服务系统中提取数据,因此能够更好地反映真实系统的特点和挑战。此外,它还显式地编码了服务之间的依赖关系,并提供了与真实事件相关的异常标签,这使得可以评估结构感知的预测方法和事件感知的异常检测方法。

关键设计:数据集包含多元时间序列,每个时间序列包含多个系统级性能指标。服务依赖图是有向图,节点表示服务,边表示服务之间的依赖关系。异常标签是专家标注的事件窗口,与真实事件对齐。论文还提供了基线预测模型(例如,ARIMA、LSTM)和异常检测模型(例如,Isolation Forest、One-Class SVM)的实验结果,作为比较的基准。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文提供了基于ChronoGraph数据集的基线实验结果,包括时间序列预测和异常检测任务。实验结果表明,现有的时间序列预测模型和异常检测算法在ChronoGraph数据集上仍有很大的提升空间。例如,LSTM模型在预测任务上的性能优于ARIMA模型,但仍远未达到完美。此外,论文还展示了异常检测算法在检测真实事件方面的能力,并指出了现有算法的局限性。

🎯 应用场景

ChronoGraph数据集可用于开发和评估更准确、更鲁棒的时间序列预测和异常检测算法,从而提高微服务系统的可靠性和性能。该数据集还可以用于研究服务依赖关系对系统行为的影响,并为容量规划、资源分配和故障诊断提供支持。此外,该数据集还可以促进结构感知预测和事件感知评估方法的研究。

📄 摘要(原文)

We present ChronoGraph, a graph-structured multivariate time series forecasting dataset built from real-world production microservices. Each node is a service that emits a multivariate stream of system-level performance metrics, capturing CPU, memory, and network usage patterns, while directed edges encode dependencies between services. The primary task is forecasting future values of these signals at the service level. In addition, ChronoGraph provides expert-annotated incident windows as anomaly labels, enabling evaluation of anomaly detection methods and assessment of forecast robustness during operational disruptions. Compared to existing benchmarks from industrial control systems or traffic and air-quality domains, ChronoGraph uniquely combines (i) multivariate time series, (ii) an explicit, machine-readable dependency graph, and (iii) anomaly labels aligned with real incidents. We report baseline results spanning forecasting models, pretrained time-series foundation models, and standard anomaly detectors. ChronoGraph offers a realistic benchmark for studying structure-aware forecasting and incident-aware evaluation in microservice systems.