IM-Chat: A Multi-agent LLM Framework Integrating Tool-Calling and Diffusion Modeling for Knowledge Transfer in Injection Molding Industry

📄 arXiv: 2507.15268v2 📥 PDF

作者: Junhyeong Lee, Joon-Young Kim, Heekyu Kim, Inhyo Lee, Seunghwa Ryu

分类: cs.AI, cs.MA

发布日期: 2025-07-21 (更新: 2025-10-22)


💡 一句话要点

IM-Chat:集成工具调用和扩散模型的注塑行业多智能体LLM知识迁移框架

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 大型语言模型 知识迁移 注塑行业 检索增强生成

📋 核心要点

  1. 注塑行业面临经验知识传承难题,资深员工退休和语言障碍加剧了知识流失,亟需有效解决方案。
  2. IM-Chat利用多智能体LLM框架,结合检索增强生成和工具调用,从文档和现场数据中学习,无需微调即可适应。
  3. 实验表明,IM-Chat在复杂任务中表现出更高的准确性,尤其在定量推理和多信息源处理方面优于微调的单智能体LLM。

📝 摘要(中文)

本研究针对注塑行业在保留和转移领域知识方面面临的挑战,特别是经验丰富的工人退休和多语言障碍阻碍有效沟通的问题,提出了IM-Chat,一个基于大型语言模型(LLM)的多智能体框架,旨在促进注塑行业的知识转移。IM-Chat集成了有限的文档知识(例如,故障排除表、手册)和通过数据驱动的过程条件生成器建模的广泛的现场数据,该生成器从温度和湿度等环境输入中推断出最佳制造设置,从而实现稳健且上下文感知的任务解决。通过采用检索增强生成(RAG)策略和模块化架构中的工具调用代理,IM-Chat确保了适应性,而无需进行微调。通过领域专家使用10分制评估GPT-4o、GPT-4o-mini和GPT-3.5-turbo在100个单工具和60个混合任务中的性能,重点关注相关性和正确性,并使用GPT-4o在领域自适应指令提示的指导下进行自动评估。评估结果表明,能力更强的模型往往能获得更高的准确率,尤其是在复杂的、工具集成的场景中。此外,与微调的单智能体LLM相比,IM-Chat在定量推理方面表现出更高的准确率,并且在处理多个信息源方面具有更好的可扩展性。总而言之,这些发现证明了多智能体LLM系统在工业知识工作流程中的可行性,并将IM-Chat确立为一种可扩展且通用的AI辅助制造决策支持方法。

🔬 方法详解

问题定义:注塑行业知识传承困难,资深员工经验难以有效传递,现有方法依赖人工整理的文档,缺乏对现场数据的利用,且难以适应多语言环境和复杂场景。现有方法的痛点在于知识获取不全面、适应性差、可扩展性不足。

核心思路:利用多智能体LLM框架,将领域知识分解为多个智能体负责的不同方面,通过检索增强生成(RAG)从文档和现场数据中提取信息,并使用工具调用代理执行特定任务,从而实现知识的有效整合和利用。这种设计旨在提高知识获取的全面性、任务处理的灵活性和系统的可扩展性。

技术框架:IM-Chat框架包含以下主要模块:1) 知识库:存储文档知识(如故障排除表、手册)和现场数据(如温度、湿度等);2) 数据驱动的过程条件生成器:从现场数据中推断最佳制造设置;3) 检索模块:根据用户查询从知识库中检索相关信息;4) LLM智能体:利用检索到的信息和工具调用代理执行任务;5) 评估模块:评估LLM智能体的性能。整体流程是:用户提出问题,检索模块检索相关信息,LLM智能体利用检索到的信息和工具调用代理生成答案,评估模块评估答案的质量。

关键创新:最重要的技术创新点在于将多智能体LLM框架应用于注塑行业知识传承,并结合了检索增强生成和工具调用。与现有方法的本质区别在于,IM-Chat能够从多个信息源(包括文档和现场数据)中学习,并利用工具调用代理执行特定任务,从而实现知识的有效整合和利用。此外,IM-Chat无需进行微调,即可适应不同的任务和场景。

关键设计:论文中没有详细描述关键的参数设置、损失函数、网络结构等技术细节。但提到了使用检索增强生成(RAG)策略和工具调用代理,这些都是LLM应用中的常用技术。具体实现细节未知。

📊 实验亮点

实验结果表明,IM-Chat在100个单工具和60个混合任务中表现出良好的性能。与微调的单智能体LLM相比,IM-Chat在定量推理方面表现出更高的准确率,并且在处理多个信息源方面具有更好的可扩展性。更强大的模型(如GPT-4o)在复杂任务中表现出更高的准确性。

🎯 应用场景

IM-Chat可应用于注塑行业的AI辅助决策支持,帮助工程师快速查找故障原因、优化生产参数、培训新员工等。该研究的实际价值在于提高生产效率、降低成本、减少知识流失。未来,该框架可扩展到其他制造业领域,为企业提供智能化的知识管理和决策支持。

📄 摘要(原文)

The injection molding industry faces critical challenges in preserving and transferring field knowledge, particularly as experienced workers retire and multilingual barriers hinder effective communication. This study introduces IM-Chat, a multi-agent framework based on large language models (LLMs), designed to facilitate knowledge transfer in injection molding. IM-Chat integrates both limited documented knowledge (e.g., troubleshooting tables, manuals) and extensive field data modeled through a data-driven process condition generator that infers optimal manufacturing settings from environmental inputs such as temperature and humidity, enabling robust and context-aware task resolution. By adopting a retrieval-augmented generation (RAG) strategy and tool-calling agents within a modular architecture, IM-Chat ensures adaptability without the need for fine-tuning. Performance was assessed across 100 single-tool and 60 hybrid tasks for GPT-4o, GPT-4o-mini, and GPT-3.5-turbo by domain experts using a 10-point rubric focused on relevance and correctness, and was further supplemented by automated evaluation using GPT-4o guided by a domain-adapted instruction prompt. The evaluation results indicate that more capable models tend to achieve higher accuracy, particularly in complex, tool-integrated scenarios. In addition, compared with the fine-tuned single-agent LLM, IM-Chat demonstrated superior accuracy, particularly in quantitative reasoning, and greater scalability in handling multiple information sources. Overall, these findings demonstrate the viability of multi-agent LLM systems for industrial knowledge workflows and establish IM-Chat as a scalable and generalizable approach to AI-assisted decision support in manufacturing.