Re-Thinking Process Mining in the AI-Based Agents Era

📄 arXiv: 2408.07720v1 📥 PDF

作者: Alessandro Berti, Mayssa Maatallah, Urszula Jessen, Michal Sroka, Sonia Ayachi Ghannouchi

分类: cs.AI, cs.DB

发布日期: 2024-08-14


💡 一句话要点

提出基于AI Agent工作流的流程挖掘方法,提升LLM在复杂场景下的推理能力。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 流程挖掘 大型语言模型 AI Agent 工作流 AI Agent工作流

📋 核心要点

  1. 现有LLM在流程挖掘中处理复杂场景时,推理能力不足,难以胜任需要高级推理的任务。
  2. 论文提出AI Agent工作流(AgWf)范式,将复杂任务分解为简单工作流,并结合确定性工具与LLM的领域知识。
  3. 论文研究了AgWf的多种实现方式和AI任务类型,并使用CrewAI框架展示了流程挖掘相关的示例。

📝 摘要(中文)

大型语言模型(LLM)已成为强大的对话接口,其在流程挖掘(PM)任务中的应用展现出潜力。然而,当前最先进的LLM在需要高级推理能力的复杂场景中表现不佳。现有文献中,使用LLM实现PM主要有两种方法:基于流程挖掘工件的文本抽象提供文本洞察,以及生成可在原始工件上执行的代码。本文提出利用基于AI Agent的工作流(AgWf)范式来增强LLM上PM的有效性。这种方法允许:i)将复杂任务分解为更简单的工作流,以及ii)将确定性工具与LLM的领域知识相结合。我们研究了AgWf的各种实现以及涉及的基于AI的任务类型。此外,我们讨论了CrewAI实现框架,并展示了与流程挖掘相关的示例。

🔬 方法详解

问题定义:论文旨在解决现有大型语言模型(LLM)在复杂流程挖掘场景中推理能力不足的问题。现有方法主要依赖于文本抽象或代码生成,前者可能丢失细节,后者对LLM的代码生成能力要求较高,难以处理复杂的流程逻辑。这些方法在处理需要高级推理、多步骤分析的流程挖掘任务时表现不佳。

核心思路:论文的核心思路是将复杂的流程挖掘任务分解为多个由AI Agent协同完成的简单子任务。每个Agent负责特定的任务,例如数据提取、模式识别、规则推导等。通过Agent之间的协作,可以有效地利用LLM的领域知识和推理能力,同时结合确定性工具的精确性和可靠性,从而提高流程挖掘的效率和准确性。

技术框架:论文提出的技术框架基于AI Agent工作流(AgWf)范式。该框架包含以下主要模块:1) 任务分解模块:将复杂的流程挖掘任务分解为多个可由Agent独立完成的子任务。2) Agent管理模块:负责Agent的创建、调度和监控。3) 知识库模块:存储流程挖掘相关的领域知识,供Agent查询和使用。4) 协作模块:实现Agent之间的信息交换和协同工作。5) 确定性工具集成模块:将确定性流程挖掘工具(如Petri网分析器)集成到Agent工作流中。

关键创新:论文的关键创新在于将AI Agent工作流范式引入到流程挖掘领域。与传统的基于LLM的流程挖掘方法相比,该方法能够更好地利用LLM的领域知识和推理能力,同时结合确定性工具的精确性和可靠性。通过Agent之间的协作,可以有效地处理复杂的流程挖掘任务,并提高流程挖掘的效率和准确性。

关键设计:论文讨论了CrewAI框架在流程挖掘中的应用。CrewAI提供了一种便捷的方式来创建和管理多个Agent,并实现Agent之间的协作。论文还探讨了不同类型的AI任务在Agent工作流中的应用,例如文本摘要、实体识别、关系抽取等。具体的参数设置、损失函数、网络结构等技术细节取决于所使用的LLM和确定性工具,论文侧重于整体框架的设计和Agent的协作机制。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

由于论文主要侧重于方法论的提出和框架的构建,以及对现有工具的整合利用,因此没有提供具体的实验数据和性能指标。论文通过示例展示了AI Agent工作流在流程挖掘中的应用,验证了该方法的可行性和潜力。未来的研究可以进一步评估该方法在不同流程挖掘场景下的性能,并与其他方法进行比较。

🎯 应用场景

该研究成果可应用于各种流程挖掘场景,例如企业流程优化、医疗流程改进、金融风险管理等。通过利用AI Agent工作流,可以更有效地分析复杂的流程数据,发现潜在的问题和瓶颈,并提出改进建议。该研究有望推动流程挖掘技术在实际应用中的普及和发展,为企业和社会带来更大的价值。

📄 摘要(原文)

Large Language Models (LLMs) have emerged as powerful conversational interfaces, and their application in process mining (PM) tasks has shown promising results. However, state-of-the-art LLMs struggle with complex scenarios that demand advanced reasoning capabilities. In the literature, two primary approaches have been proposed for implementing PM using LLMs: providing textual insights based on a textual abstraction of the process mining artifact, and generating code executable on the original artifact. This paper proposes utilizing the AI-Based Agents Workflow (AgWf) paradigm to enhance the effectiveness of PM on LLMs. This approach allows for: i) the decomposition of complex tasks into simpler workflows, and ii) the integration of deterministic tools with the domain knowledge of LLMs. We examine various implementations of AgWf and the types of AI-based tasks involved. Additionally, we discuss the CrewAI implementation framework and present examples related to process mining.