LLM4SFC: Sequential Function Chart Generation via Large Language Models

📄 arXiv: 2512.06787v1 📥 PDF

作者: Ofek Glick, Vladimir Tchuiev, Marah Ghoummaid, Michal Moshkovitz, Dotan Di-Castro

分类: cs.CL

发布日期: 2025-12-07


💡 一句话要点

LLM4SFC:利用大语言模型生成顺序功能图,实现工业工作流自动化编程

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 顺序功能图生成 大语言模型 自动化编程 工业控制 PLC编程 检索增强生成 结构化生成

📋 核心要点

  1. 现有方法难以利用大语言模型直接生成可执行的顺序功能图(SFC),主要挑战在于SFC的图形特性和嵌入的结构化文本。
  2. LLM4SFC框架通过简化表示、微调和RAG增强、结构化生成等手段,使大语言模型能够生成符合工业标准的SFC代码。
  3. 实验结果表明,LLM4SFC在生成语法正确的SFC程序方面表现出色,成功率达到75%-94%,显著提升了自动化工业编程效率。

📝 摘要(中文)

本文提出LLM4SFC,这是一个首个能够接收工业工作流的自然语言描述并生成可执行顺序功能图(SFC)的框架。由于SFC的图形特性以及嵌入其中的结构化文本(ST)动作,直接使用标准生成技术具有挑战性,容易导致与工业工具链不兼容的不可执行代码。LLM4SFC基于三个关键组件:(i)一种简化的结构化表示,用于捕获必要的拓扑结构、内联ST以及降低文本冗余;(ii)微调和少样本检索增强生成(RAG),以对齐SFC编程规范;(iii)一种结构化生成方法,通过实时剪枝非法token来确保符合SFC的文本格式。在来自自动化制造项目的真实SFC数据集上,使用开源和专有LLM对LLM4SFC进行了评估。结果表明,LLM4SFC能够可靠地生成语法上有效的SFC程序,有效地桥接了图形化和文本化PLC语言,实现了75%-94%的生成成功率,为自动化工业编程铺平了道路。

🔬 方法详解

问题定义:论文旨在解决如何利用大语言模型(LLM)自动生成可执行的顺序功能图(SFC)的问题。现有的基于LLM的代码生成方法主要集中在文本编程语言,例如结构化文本(ST)。然而,SFC作为一种图形化的PLC编程语言,其图形特性和嵌入的ST动作使得直接应用现有方法具有挑战性,容易生成与工业工具链不兼容的不可执行代码。

核心思路:论文的核心思路是将SFC的生成过程分解为三个关键步骤,并针对每个步骤设计特定的技术方案。首先,通过简化的结构化表示来降低SFC的复杂性,使其更易于被LLM理解和处理。其次,利用微调和检索增强生成(RAG)来对齐SFC编程规范,确保生成的代码符合工业标准。最后,采用结构化生成方法,通过实时剪枝非法token来保证生成的SFC代码在语法上是有效的。

技术框架:LLM4SFC框架包含三个主要组件:(1) 简化的结构化表示:将SFC转换为一种更简洁、更易于LLM处理的文本表示形式,保留了SFC的关键拓扑结构和ST动作。(2) 微调和RAG:利用SFC数据集对LLM进行微调,并结合RAG技术,从SFC代码库中检索相关的代码片段,以提高生成质量。(3) 结构化生成:在生成过程中,实时检查生成的token是否符合SFC的语法规则,并剪枝掉不合法的token,以确保生成的代码在语法上是有效的。

关键创新:LLM4SFC的关键创新在于其针对SFC的特性,设计了一套完整的生成框架,包括简化的结构化表示、微调和RAG以及结构化生成。与直接使用LLM生成SFC代码的方法相比,LLM4SFC能够更好地理解SFC的结构和语义,并生成更符合工业标准的、可执行的代码。

关键设计:在简化的结构化表示方面,论文设计了一种特定的文本格式来表示SFC的步骤、转换和动作。在微调和RAG方面,论文选择了合适的LLM架构,并设计了相应的训练目标和检索策略。在结构化生成方面,论文实现了一个语法检查器,用于实时验证生成的token是否符合SFC的语法规则。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

LLM4SFC在真实世界的SFC数据集上进行了评估,结果表明,该框架能够可靠地生成语法上有效的SFC程序,生成成功率达到75%-94%。与直接使用LLM生成SFC代码的方法相比,LLM4SFC能够显著提高生成质量和效率。这些实验结果证明了LLM4SFC在自动化工业编程方面的潜力。

🎯 应用场景

LLM4SFC具有广泛的应用前景,可用于自动化制造、机器人控制、智能交通等领域。它可以帮助工程师快速生成PLC程序,缩短开发周期,降低开发成本。此外,LLM4SFC还可以用于教育和培训,帮助学生和工程师更好地理解和掌握SFC编程技术。未来,LLM4SFC有望成为工业自动化领域的重要工具,推动工业智能化发展。

📄 摘要(原文)

While Large Language Models (LLMs) are increasingly used for synthesizing textual PLC programming languages like Structured Text (ST) code, other IEC 61131-3 standard graphical languages like Sequential Function Charts (SFCs) remain underexplored. Generating SFCs is challenging due to graphical nature and ST actions embedded within, which are not directly compatible with standard generation techniques, often leading to non-executable code that is incompatible with industrial tool-chains In this work, we introduce LLM4SFC, the first framework to receive natural-language descriptions of industrial workflows and provide executable SFCs. LLM4SFC is based on three components: (i) A reduced structured representation that captures essential topology and in-line ST and reduced textual verbosity; (ii) Fine-tuning and few-shot retrieval-augmented generation (RAG) for alignment with SFC programming conventions; and (iii) A structured generation approach that prunes illegal tokens in real-time to ensure compliance with the textual format of SFCs. We evaluate LLM4SFC on a dataset of real-world SFCs from automated manufacturing projects, using both open-source and proprietary LLMs. The results show that LLM4SFC reliably generates syntactically valid SFC programs effectively bridging graphical and textual PLC languages, achieving a generation generation success of 75% - 94%, paving the way for automated industrial programming.