Debugging Tabular Log as Dynamic Graphs

📄 arXiv: 2512.22903v1 📥 PDF

作者: Chumeng Liang, Zhanyang Jin, Zahaib Akhtar, Mona Pereira, Haofei Yu, Jiaxuan You

分类: cs.LG, cs.CL

发布日期: 2025-12-28


💡 一句话要点

提出GraphLogDebugger框架,利用动态图调试表格日志,提升效率与可扩展性

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 表格日志调试 动态图神经网络 异常检测 系统日志分析 事件日志 图表示学习 可扩展性 计算机系统

📋 核心要点

  1. 现有表格日志调试方法过度依赖大型语言模型,导致灵活性和可扩展性受限。
  2. GraphLogDebugger框架将表格日志建模为动态图,利用图神经网络进行调试。
  3. 实验表明,简单的动态图神经网络在真实数据集上优于大型语言模型。

📝 摘要(中文)

表格日志抽象了现实世界系统中的对象和事件,并通过更新来反映系统的变化。通过调试相应的日志条目,可以有效地检测现实世界中的不一致性。然而,目前处理富文本表格日志数据的最新进展过度依赖大型语言模型(LLMs)和其他重负载模型,因此灵活性和可扩展性有限。本文提出了一种新的框架GraphLogDebugger,用于基于动态图调试表格日志。通过为对象和事件构建异构节点,并连接节点间的边,该框架将表格日志背后的系统恢复为一个不断演化的动态图。借助我们的动态图建模,一个简单的动态图神经网络(GNN)就足以在调试表格日志方面优于LLM,这已通过计算机系统和学术论文的真实日志数据集上的实验结果得到验证。

🔬 方法详解

问题定义:现有表格日志调试方法依赖于大型语言模型(LLMs)等重负载模型,这些模型计算成本高昂,且难以针对特定领域进行定制和优化。因此,现有方法在灵活性和可扩展性方面存在局限性,难以适应大规模和多样化的日志数据。

核心思路:论文的核心思路是将表格日志数据转化为动态图结构,其中节点代表对象和事件,边代表它们之间的关系。通过这种方式,可以将日志数据中的复杂关系和时间演化信息显式地建模出来,从而利用图神经网络(GNN)进行分析和调试。这种方法旨在降低对大型语言模型的依赖,提高效率和可扩展性。

技术框架:GraphLogDebugger框架包含以下主要步骤:1) 日志解析与实体识别:从表格日志中提取对象和事件信息。2) 动态图构建:基于提取的信息构建异构动态图,节点表示对象和事件,边表示它们之间的关系,图随时间演化。3) 动态图神经网络:使用动态图神经网络学习节点和边的表示,捕捉系统状态的变化。4) 异常检测与调试:基于学习到的表示进行异常检测,并提供调试信息。

关键创新:该论文的关键创新在于将表格日志调试问题转化为动态图上的节点分类或链接预测问题。通过动态图建模,可以有效地捕捉日志数据中的时序关系和实体间的依赖关系,从而提高调试的准确性和效率。与现有方法相比,该方法避免了对大型语言模型的过度依赖,降低了计算成本,并提高了可扩展性。

关键设计:动态图神经网络的具体结构未知,但可以推测其包含图卷积层或图注意力层,用于聚合邻居节点的信息。损失函数可能包括交叉熵损失或对比学习损失,用于训练节点表示。具体的参数设置和网络结构需要根据具体的日志数据和调试任务进行调整。论文中提到使用了一个“简单的”动态 GNN,暗示可能没有采用非常复杂的网络结构。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,GraphLogDebugger框架在真实世界的计算机系统和学术论文日志数据集上,优于基于大型语言模型的调试方法。具体的性能提升数据未知,但论文强调了在调试表格日志方面,一个简单的动态图神经网络就足以超越LLM,这突出了该方法的有效性和效率。

🎯 应用场景

该研究成果可应用于计算机系统、数据库系统、网络安全等领域的日志分析与调试。通过自动检测日志中的异常行为,可以帮助运维人员快速定位问题,提高系统的可靠性和安全性。此外,该方法还可以应用于学术论文的引用关系分析,检测虚假引用等学术不端行为。未来,该方法有望扩展到更广泛的事件日志分析领域。

📄 摘要(原文)

Tabular log abstracts objects and events in the real-world system and reports their updates to reflect the change of the system, where one can detect real-world inconsistencies efficiently by debugging corresponding log entries. However, recent advances in processing text-enriched tabular log data overly depend on large language models (LLMs) and other heavy-load models, thus suffering from limited flexibility and scalability. This paper proposes a new framework, GraphLogDebugger, to debug tabular log based on dynamic graphs. By constructing heterogeneous nodes for objects and events and connecting node-wise edges, the framework recovers the system behind the tabular log as an evolving dynamic graph. With the help of our dynamic graph modeling, a simple dynamic Graph Neural Network (GNN) is representative enough to outperform LLMs in debugging tabular log, which is validated by experimental results on real-world log datasets of computer systems and academic papers.