Traceable Knowledge Graph Reasoning Enables LLM-Assisted Decision Support for Industrial VOCs in the Steel Industry
作者: Changqing Su, Yu Ding, Zuhong Lin, Hongyu Liu, Xi He, Zheng Zeng, Liqing Li
分类: cs.AI
发布日期: 2026-05-26
💡 一句话要点
Chat-ISV:基于可溯源知识图谱推理的钢铁行业VOCs治理LLM辅助决策系统
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 知识图谱 大语言模型 多智能体系统 VOCs治理 钢铁行业
📋 核心要点
- 钢铁行业VOCs治理知识分散且非结构化,通用LLM难以有效整合,易产生幻觉,影响决策。
- Chat-ISV构建钢铁行业VOCs知识图谱,结合多智能体问答系统,实现可溯源的知识推理和决策支持。
- 实验表明,Chat-ISV通过拓扑优化显著降低孤立节点,并实现了高精度、高召回率的事实可靠性。
📝 摘要(中文)
钢铁行业挥发性有机化合物(VOCs)治理的关键知识分散在非结构化的科学文献中,难以整合过程、污染物和控制技术证据。这增加了通用大语言模型(LLM)在回答低频工业问题时产生幻觉的风险。本文开发了Chat-ISV,一个知识图谱(KG)增强的多智能体问答系统,它解析整理后的钢铁行业VOCs文献语料库,构建了一个包含27180个节点和81779条语义边的Neo4j KG,并结合了提示约束提取、以块为中心的拓扑优化、多智能体路由、溯源检索、本地文献检索、开放域知识访问和交互式子图可视化。基准测试和400次专家盲评估表明,拓扑优化将孤立节点从57%减少到4.08%,Chat-ISV实现了高事实可靠性,精度为96.93%,召回率为72.63%,F1分数为0.830,平均得分为1.69/2.00。通过将零散的环境工程文献转化为可追溯、可查询和面向决策支持的知识,Chat-ISV为可靠的LLM部署和专业工业领域中的智能污染控制决策支持建立了一个可扩展的环境信息学范例。
🔬 方法详解
问题定义:钢铁行业VOCs治理面临的关键挑战是相关知识分散在大量非结构化的文献中,难以有效整合和利用。现有通用大语言模型在处理此类专业领域问题时,容易产生幻觉,导致决策失误。因此,需要一种能够从文献中提取、整合和推理知识,并提供可靠决策支持的系统。
核心思路:Chat-ISV的核心思路是构建一个专门针对钢铁行业VOCs的知识图谱,并利用多智能体问答系统进行知识推理和检索。通过将非结构化文献转化为结构化的知识图谱,可以更好地组织和利用知识。多智能体系统则可以协同完成复杂的问答任务,并提供可溯源的答案。
技术框架:Chat-ISV的整体架构包括以下几个主要模块:1) 文献解析模块:解析钢铁行业VOCs相关文献,提取关键信息。2) 知识图谱构建模块:基于提取的信息构建Neo4j知识图谱,包含过程、污染物和控制技术等实体和关系。3) 拓扑优化模块:优化知识图谱的拓扑结构,减少孤立节点。4) 多智能体问答系统:包含多个智能体,分别负责提示约束提取、块中心拓扑优化、多智能体路由、溯源检索、本地文献检索和开放域知识访问。5) 交互式子图可视化模块:可视化知识图谱的子图,方便用户理解和探索知识。
关键创新:Chat-ISV的关键创新在于将知识图谱和多智能体问答系统相结合,实现了可溯源的知识推理和决策支持。此外,该系统还采用了以块为中心的拓扑优化方法,有效减少了知识图谱中的孤立节点,提高了知识图谱的质量。
关键设计:在知识图谱构建方面,采用了Neo4j图数据库,并设计了包含27180个节点和81779条语义边的图结构。在多智能体问答系统方面,采用了prompt-constrained extraction, chunk-centered topology optimization, multi-agent routing, source-backtracking retrieval, local literature retrieval, open-domain knowledge access等技术。拓扑优化算法的具体参数设置未知。
🖼️ 关键图片
📊 实验亮点
Chat-ISV通过拓扑优化将知识图谱中的孤立节点从57%降低到4.08%。在专家盲评估中,Chat-ISV实现了高事实可靠性,精度为96.93%,召回率为72.63%,F1分数为0.830,平均得分为1.69/2.00。这些结果表明,Chat-ISV能够提供可靠的知识和决策支持。
🎯 应用场景
Chat-ISV可应用于钢铁行业VOCs治理的决策支持,帮助工程师和管理人员快速获取相关知识,评估不同控制技术的有效性,并制定合理的治理方案。该研究为其他专业工业领域构建可靠的LLM部署和智能污染控制决策支持系统提供了一个可扩展的环境信息学范例。
📄 摘要(原文)
Key knowledge for steel-industry volatile organic compounds (VOCs) governance is scattered across unstructured scientific literature, making it difficult to integrate process, pollutant, and control-technology evidence and increasing the risk of hallucination when general large language models (LLMs) answer low-frequency industrial questions. Here we developed Chat-ISV, a knowledge graph (KG) enhanced multi-agent Q&A system that parses a curated steel-industry VOCs literature corpus, constructs a Neo4j KG with 27180 nodes and 81779 semantic edges, and combines prompt-constrained extraction, chunk-centered topology optimization, multi-agent routing, source-backtracking retrieval, local literature retrieval, open-domain knowledge access, and interactive subgraph visualization. Benchmark tests and 400 expert blind evaluations showed that topology optimization reduced isolated nodes from 57% to 4.08% and that Chat-ISV achieved high factual reliability, with 96.93% precision, 72.63% recall, an F1-score of 0.830, and a mean score of 1.69/2.00. By converting fragmented environmental-engineering literature into traceable, queryable, and decision-support-oriented knowledge, Chat-ISV establishes a scalable environmental-informatics paradigm for reliable LLM deployment and intelligent pollution-control decision support in specialized industrial domains.