PMAx: An Agentic Framework for AI-Driven Process Mining

📄 arXiv: 2603.15351v1 📥 PDF

作者: Anton Antonov, Humam Kourani, Alessandro Berti, Gyunam Park, Wil M. P. van der Aalst

分类: cs.AI, cs.MA

发布日期: 2026-03-16

备注: Submitted to EMMSAD 2026 (tool demonstration track), under review


💡 一句话要点

PMAx:一个用于AI驱动的过程挖掘的Agentic框架,解决LLM直接应用于过程挖掘的局限性。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 过程挖掘 大型语言模型 多智能体系统 数据隐私 自动化分析

📋 核心要点

  1. 现有过程挖掘方法依赖于专业知识和工具,使得非技术用户难以直接利用事件日志数据。
  2. PMAx 采用多智能体架构,工程师智能体负责本地计算,分析师智能体负责结果解释,实现隐私保护和精确分析。
  3. PMAx 框架通过分离计算和解释,在保证数据隐私和数学准确性的前提下,赋能非技术用户进行过程挖掘。

📝 摘要(中文)

过程挖掘为组织工作流程提供了强大的洞察力,但提取这些洞察力通常需要专门的查询语言和数据科学工具方面的专业知识。大型语言模型(LLM)有潜力通过使业务用户能够通过自然语言与过程数据交互来普及过程挖掘。然而,使用LLM作为原始事件日志上的直接分析引擎带来了根本性的挑战:LLM难以进行确定性推理,并且可能产生幻觉指标,而将大型敏感日志发送到外部AI服务会引发严重的数据隐私问题。为了解决这些限制,我们提出了PMAx,一个充当虚拟过程分析师的自主agentic框架。PMAx不依赖LLM来生成过程模型或计算分析结果,而是采用了一种保护隐私的多代理架构。工程师代理分析事件日志元数据并自主生成本地脚本,以运行已建立的过程挖掘算法,计算精确的指标,并生成诸如过程模型、汇总表和可视化之类的工件。然后,分析师代理解释这些见解和工件以编译全面的报告。通过将计算与解释分离并在本地执行分析,PMAx确保了数学准确性和数据隐私,同时使非技术用户能够将高级业务问题转化为可靠的过程见解。

🔬 方法详解

问题定义:现有过程挖掘方法需要用户具备专业的知识和技能,才能使用专门的查询语言和数据科学工具从事件日志中提取有价值的信息。直接使用大型语言模型(LLM)进行过程挖掘面临确定性推理不足、容易产生幻觉以及数据隐私泄露等问题。因此,如何让非技术用户能够安全、准确地进行过程挖掘是一个亟待解决的问题。

核心思路:PMAx的核心思路是构建一个多智能体框架,将过程挖掘任务分解为计算和解释两个阶段,并分别由不同的智能体负责。工程师智能体负责在本地执行预定义的脚本,计算精确的指标并生成过程模型等工件;分析师智能体则负责解释这些工件,生成易于理解的报告。通过这种方式,PMAx避免了直接使用LLM处理敏感数据,保证了数据隐私和计算准确性。

技术框架:PMAx框架包含两个主要智能体:工程师智能体和分析师智能体。工程师智能体首先分析事件日志的元数据,然后自动生成本地脚本,这些脚本使用已有的过程挖掘算法来计算指标和生成工件,例如过程模型、汇总表和可视化结果。分析师智能体接收这些工件,并利用LLM来解释这些结果,生成最终的报告。整个过程在本地执行,无需将原始事件日志发送到外部服务。

关键创新:PMAx的关键创新在于其多智能体架构,该架构将过程挖掘任务分解为计算和解释两个阶段,并分别由不同的智能体负责。这种分离使得PMAx能够利用LLM的自然语言理解能力,同时避免了LLM在确定性推理方面的不足和数据隐私问题。与直接使用LLM进行过程挖掘的方法相比,PMAx更加安全、准确和易于使用。

关键设计:工程师智能体使用预定义的脚本和成熟的过程挖掘算法,例如Alpha算法、启发式挖掘等,来计算指标和生成工件。分析师智能体使用提示工程技术,引导LLM解释这些工件,并生成易于理解的报告。PMAx框架的设计重点在于保证计算的准确性和数据隐私,同时提供友好的用户界面,使得非技术用户也能轻松使用。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文提出的PMAx框架,通过多智能体架构,实现了在本地安全、准确地进行过程挖掘。工程师智能体负责计算,分析师智能体负责解释,有效解决了LLM直接应用于过程挖掘的局限性,使得非技术用户也能轻松获得过程洞察。

🎯 应用场景

PMAx 可应用于各种需要过程挖掘的领域,例如医疗保健、金融服务、供应链管理等。它可以帮助企业识别流程瓶颈、优化资源分配、提高运营效率。通过赋能非技术用户进行过程挖掘,PMAx 有助于企业更好地理解和改进其业务流程,从而提升竞争力。

📄 摘要(原文)

Process mining provides powerful insights into organizational workflows, but extracting these insights typically requires expertise in specialized query languages and data science tools. Large Language Models (LLMs) offer the potential to democratize process mining by enabling business users to interact with process data through natural language. However, using LLMs as direct analytical engines over raw event logs introduces fundamental challenges: LLMs struggle with deterministic reasoning and may hallucinate metrics, while sending large, sensitive logs to external AI services raises serious data-privacy concerns. To address these limitations, we present PMAx, an autonomous agentic framework that functions as a virtual process analyst. Rather than relying on LLMs to generate process models or compute analytical results, PMAx employs a privacy-preserving multi-agent architecture. An Engineer agent analyzes event-log metadata and autonomously generates local scripts to run established process mining algorithms, compute exact metrics, and produce artifacts such as process models, summary tables, and visualizations. An Analyst agent then interprets these insights and artifacts to compile comprehensive reports. By separating computation from interpretation and executing analysis locally, PMAx ensures mathematical accuracy and data privacy while enabling non-technical users to transform high-level business questions into reliable process insights.