Chatting with your ERP: A Recipe
作者: Jorge Ruiz Gómez, Lidia Andrés Susinos, Jorge Alamo Olivé, Sonia Rey Osorno, Manuel Luis Gonzalez Hernández
分类: cs.AI, cs.DB, cs.ET, cs.HC, cs.MA
发布日期: 2025-07-31
备注: 11 pages, includes 3 tables summarizing schema and model performance. Submitted on July 31, 2025. Targets integration of LLM agents with ERP systems using open-weight models and Ollama deployment
💡 一句话要点
提出双Agent架构,利用LLM实现自然语言查询工业ERP系统。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 自然语言查询 大型语言模型 ERP系统 SQL生成 双Agent架构 推理 批判
📋 核心要点
- 现有方法难以直接使用自然语言查询ERP系统,需要专业人员编写SQL语句。
- 提出双Agent架构,一个Agent负责推理生成SQL,另一个Agent负责批判和改进SQL。
- 实验表明,该Agent能够有效地将自然语言查询转换为SQL,并提高了查询的可靠性。
📝 摘要(中文)
本文介绍了一个大型语言模型(LLM)Agent的设计、实现和评估,该Agent能够与工业生产级的ERP系统进行交互。该Agent能够解释自然语言查询,并将其转换为可执行的SQL语句,充分利用了开源LLM。为了提高查询生成的可靠性,本文提出了一种新颖的双Agent架构,该架构结合了推理和批判阶段。
🔬 方法详解
问题定义:现有方法需要专业人员编写SQL语句才能查询ERP系统,这限制了非技术人员的使用。如何让用户使用自然语言直接与ERP系统交互,降低使用门槛,是本文要解决的问题。现有方法的痛点在于自然语言到SQL的转换准确率和可靠性较低。
核心思路:本文的核心思路是利用大型语言模型(LLM)的自然语言理解和生成能力,构建一个能够将自然语言查询转换为SQL语句的Agent。为了提高转换的准确性和可靠性,采用了双Agent架构,一个Agent负责生成SQL语句,另一个Agent负责评估和改进生成的SQL语句。
技术框架:整体架构包含两个主要Agent:推理Agent和批判Agent。推理Agent接收自然语言查询,并生成相应的SQL语句。批判Agent接收推理Agent生成的SQL语句,并对其进行评估和改进,生成更准确和可靠的SQL语句。整个流程迭代进行,直到生成满足要求的SQL语句。
关键创新:最重要的技术创新点是双Agent架构,通过推理和批判两个阶段,提高了SQL语句生成的可靠性。与单Agent方法相比,双Agent架构能够更好地识别和纠正SQL语句中的错误,从而提高查询的准确性。
关键设计:论文使用了开源的LLM作为Agent的基础模型。具体参数设置和损失函数等技术细节在论文中没有详细说明,属于未知信息。推理Agent和批判Agent之间的交互方式是关键设计之一,具体实现方式未知。
📊 实验亮点
论文提出了双Agent架构,提高了自然语言查询转换为SQL语句的可靠性。具体的性能数据、对比基线和提升幅度在摘要中没有提及,属于未知信息。实验结果表明该Agent能够有效地将自然语言查询转换为SQL,但具体效果需要参考论文全文。
🎯 应用场景
该研究成果可应用于各种需要与数据库进行交互的场景,例如智能客服、数据分析等。通过自然语言查询,用户可以更方便地获取所需信息,提高工作效率。未来,该技术可以进一步扩展到其他类型的数据库和应用场景,实现更智能化的数据交互。
📄 摘要(原文)
This paper presents the design, implementation, and evaluation behind a Large Language Model (LLM) agent that chats with an industrial production-grade ERP system. The agent is capable of interpreting natural language queries and translating them into executable SQL statements, leveraging open-weight LLMs. A novel dual-agent architecture combining reasoning and critique stages was proposed to improve query generation reliability.