Bridging Domain Knowledge and Process Discovery Using Large Language Models

作者: Ali Norouzifar, Humam Kourani, Marcus Dees, Wil van der Aalst

分类: cs.AI, cs.CL

发布日期: 2024-08-30

备注: This paper is accepted at the AI4BPM 2024 workshop and to be published in their proceedings

💡 一句话要点

利用大语言模型桥接领域知识与流程挖掘，提升流程模型质量

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 流程挖掘 大语言模型 领域知识 流程模型 业务流程管理

📋 核心要点

现有流程挖掘方法未能充分利用领域专家知识和流程文档，导致挖掘结果可能与实际业务流程存在偏差。
该论文提出利用大语言模型（LLM）提取领域知识，并将其转化为规则，指导流程模型的构建，确保模型与领域知识对齐。
通过与UWV员工保险机构的案例研究，验证了该框架的实用性和有效性，表明其能够提升流程模型的质量。

📝 摘要（中文）

发现高质量的流程模型对于诸如一致性检查和流程改进等不同的流程分析任务至关重要。自动化的流程挖掘方法通常忽略了宝贵的领域知识。这些知识，包括领域专家的见解和详细的流程文档，在流程挖掘过程中很大程度上未被利用。本文利用大型语言模型（LLM）将这些知识直接整合到流程挖掘中。我们使用从LLM导出的规则来指导模型构建，确保与领域知识和实际流程执行的一致性。通过整合LLM，我们创建了自然语言表达的流程知识与鲁棒流程模型发现之间的桥梁，从而显著推进了流程挖掘方法。为了展示我们框架的可用性，我们与UWV员工保险机构进行了一个案例研究，证明了它的实际效益和有效性。

🔬 方法详解

问题定义：流程挖掘旨在从事件日志中自动发现流程模型。然而，现有的流程挖掘算法往往忽略了领域专家拥有的丰富知识和详细的流程文档。这导致挖掘出的流程模型可能不够准确，无法反映真实的业务流程，从而影响后续的流程分析和优化工作。现有方法的痛点在于无法有效整合这些重要的领域知识。

核心思路：该论文的核心思路是利用大型语言模型（LLM）的自然语言理解和生成能力，从领域知识（如专家访谈记录、流程文档）中提取规则，并将这些规则作为约束条件，指导流程模型的构建过程。通过这种方式，确保挖掘出的流程模型既能反映事件日志中的行为，又能符合领域专家的认知和业务规则。

技术框架：该框架主要包含以下几个阶段： 1. 知识获取：从领域专家和流程文档中收集领域知识。 2. 规则提取：使用LLM对收集到的知识进行分析，提取出流程规则，例如“如果A发生，则B必须发生”。 3. 模型构建：利用传统的流程挖掘算法（如启发式挖掘、α算法等）从事件日志中构建初始流程模型。 4. 规则引导：将提取出的规则作为约束条件，对初始流程模型进行优化，使其满足这些规则。 5. 模型评估：评估优化后的流程模型与事件日志和领域知识的符合程度。

关键创新：该论文最重要的技术创新点在于将大型语言模型（LLM）引入到流程挖掘领域，利用LLM的自然语言处理能力，实现了领域知识与流程挖掘算法的有效整合。与现有方法相比，该方法能够更充分地利用领域知识，从而提高流程模型的准确性和可信度。

关键设计：论文中关键的设计包括： 1. LLM的选择和微调：选择合适的LLM，并可能需要针对特定的领域知识进行微调，以提高规则提取的准确性。 2. 规则表示：将从LLM中提取的规则表示成一种形式化的语言，以便能够被流程挖掘算法所理解和利用。 3. 约束优化：设计合适的约束优化算法，将提取出的规则作为约束条件，对流程模型进行优化。

📊 实验亮点

该论文通过与UWV员工保险机构的案例研究，验证了该框架的实用性和有效性。实验结果表明，与传统的流程挖掘方法相比，该方法能够生成更符合领域知识和实际业务流程的流程模型。具体的性能数据（如准确率、召回率等）未知，但案例研究表明该方法具有显著的提升效果。

🎯 应用场景

该研究成果可广泛应用于各种业务流程管理领域，例如金融、医疗、制造等。通过整合领域知识，可以提高流程模型的准确性和可信度，从而支持更有效的流程分析、优化和自动化。未来，该方法还可以应用于流程预测、流程推荐等更高级的流程管理任务。

📄 摘要（原文）

Discovering good process models is essential for different process analysis tasks such as conformance checking and process improvements. Automated process discovery methods often overlook valuable domain knowledge. This knowledge, including insights from domain experts and detailed process documentation, remains largely untapped during process discovery. This paper leverages Large Language Models (LLMs) to integrate such knowledge directly into process discovery. We use rules derived from LLMs to guide model construction, ensuring alignment with both domain knowledge and actual process executions. By integrating LLMs, we create a bridge between process knowledge expressed in natural language and the discovery of robust process models, advancing process discovery methodologies significantly. To showcase the usability of our framework, we conducted a case study with the UWV employee insurance agency, demonstrating its practical benefits and effectiveness.

Bridging Domain Knowledge and Process Discovery Using Large Language Models

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理