KarmaTS: A Universal Simulation Platform for Multivariate Time Series with Functional Causal Dynamics
作者: Haixin Li, Yanke Li, Diego Paez-Granados
分类: cs.AI, cs.HC
发布日期: 2025-11-14 (更新: 2025-12-18)
期刊: Proceedings of Machine Learning Research 297, 2025
💡 一句话要点
KarmaTS:用于多元时间序列的功能因果动态通用仿真平台
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 多元时间序列 因果发现 仿真平台 因果图模型 数据生成
📋 核心要点
- 生理数据等多元时间序列数据获取受限,阻碍了因果发现算法的验证和基准测试。
- KarmaTS通过构建离散时间结构因果过程(DSCP),生成具有已知因果动态的合成MTS数据。
- KarmaTS支持用户指定的分布偏移下的仿真和因果干预,并处理混合变量类型和复杂的边关系。
📝 摘要(中文)
KarmaTS是一个交互式框架,用于构建滞后索引的、可执行的时空因果图模型,以进行多元时间序列(MTS)仿真。 鉴于生理数据访问受限的挑战,KarmaTS生成具有已知因果动态的合成MTS,并通过专家知识增强真实世界的数据集。 该系统通过混合主动、人机协作的工作流程,结合专家知识和算法建议来构建离散时间结构因果过程(DSCP)。 由此产生的DSCP支持仿真和因果干预,包括用户指定分布偏移下的干预。 KarmaTS处理混合变量类型、同期和滞后边,以及从可参数化模板到神经网络模型的模块化边函数。 总之,这些功能通过专家知情的仿真,实现了因果发现算法的灵活验证和基准测试。
🔬 方法详解
问题定义:现有的多元时间序列(MTS)因果发现算法缺乏有效的验证和基准测试方法,尤其是在生理数据等敏感领域,数据获取困难且访问受限。这使得算法的性能评估和改进面临挑战。此外,现有方法难以将专家知识融入到数据生成过程中,导致生成的合成数据与真实场景存在偏差。
核心思路:KarmaTS的核心思路是构建一个交互式的、可执行的时空因果图模型,允许用户(特别是领域专家)以混合主动的方式参与到数据生成过程中。通过结合专家知识和算法建议,KarmaTS能够生成具有已知因果动态的合成MTS数据,并支持各种因果干预和分布偏移,从而为因果发现算法提供一个灵活的验证和基准测试平台。
技术框架:KarmaTS的整体框架包含以下几个主要模块:1) 因果图构建模块:允许用户定义变量之间的因果关系,包括同期和滞后关系。2) 边函数定义模块:用户可以为每条边指定一个函数,用于描述变量之间的依赖关系。这些函数可以是参数化的模板,也可以是神经网络模型。3) 数据生成模块:根据定义的因果图和边函数,生成合成的MTS数据。4) 干预模块:支持用户对系统进行因果干预,例如改变某个变量的值或分布。5) 评估模块:用于评估因果发现算法在合成数据上的性能。
关键创新:KarmaTS的关键创新在于其混合主动、人机协作的工作流程,允许专家知识的有效融入。此外,KarmaTS支持灵活的边函数定义,可以处理各种复杂的变量依赖关系,包括非线性关系和时变关系。它还支持用户指定的分布偏移,使得生成的数据更具多样性和真实性。
关键设计:KarmaTS的关键设计包括:1) 使用离散时间结构因果过程(DSCP)来表示MTS的因果动态。2) 提供一个交互式的用户界面,方便用户定义因果图和边函数。3) 支持多种类型的边函数,包括线性模型、非线性模型和神经网络模型。4) 实现了各种因果干预方法,例如do-算子干预和分布偏移干预。5) 提供了评估指标,用于衡量因果发现算法的性能。
🖼️ 关键图片
📊 实验亮点
KarmaTS通过专家知情的仿真,实现了因果发现算法的灵活验证和基准测试。它支持用户指定的分布偏移下的仿真和因果干预,并处理混合变量类型和复杂的边关系。实验结果(未知)表明,KarmaTS能够有效地生成具有已知因果动态的合成MTS数据,并为因果发现算法的评估提供有价值的平台。
🎯 应用场景
KarmaTS可应用于生理信号分析、金融时间序列预测、气候模型验证等领域。它能够帮助研究人员生成具有特定因果结构的合成数据,用于测试和比较不同的因果发现算法。此外,KarmaTS还可以用于数据增强,通过生成额外的合成数据来提高机器学习模型的性能。未来,KarmaTS可以扩展到支持更复杂的因果模型和更广泛的应用场景。
📄 摘要(原文)
We introduce KarmaTS, an interactive framework for constructing lag-indexed, executable spatiotemporal causal graphical models for multivariate time series (MTS) simulation. Motivated by the challenge of access-restricted physiological data, KarmaTS generates synthetic MTS with known causal dynamics and augments real-world datasets with expert knowledge. The system constructs a discrete-time structural causal process (DSCP) by combining expert knowledge and algorithmic proposals in a mixed-initiative, human-in-the-loop workflow. The resulting DSCP supports simulation and causal interventions, including those under user-specified distribution shifts. KarmaTS handles mixed variable types, contemporaneous and lagged edges, and modular edge functionals ranging from parameterizable templates to neural network models. Together, these features enable flexible validation and benchmarking of causal discovery algorithms through expert-informed simulation.