Towards Next-Generation Urban Decision Support Systems through AI-Powered Construction of Scientific Ontology using Large Language Models -- A Case in Optimizing Intermodal Freight Transportation

📄 arXiv: 2405.19255v3 📥 PDF

作者: Jose Tupayachi, Haowen Xu, Olufemi A. Omitaomu, Mustafa Can Camur, Aliza Sharmin, Xueping Li

分类: cs.AI

发布日期: 2024-05-29 (更新: 2024-09-06)

期刊: Smart Cities, 2024, 7(5), 2392-2421

DOI: 10.3390/smartcities7050094


💡 一句话要点

利用大语言模型构建科学本体,助力下一代城市决策支持系统。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 知识图谱 本体构建 城市决策支持系统 多式联运

📋 核心要点

  1. 现有城市决策支持系统在处理复杂问题时,需要领域专家进行数据和模拟驱动的决策,成本高昂。
  2. 论文提出利用大语言模型(LLM)自动构建领域本体的集成工作流程,降低对领域专家的依赖。
  3. 通过案例研究验证了该方法在优化多式联运方面的可行性,并与现有本体进行了对比分析。

📝 摘要(中文)

人工智能模型在各种优化系统中的应用日益增多。然而,解决复杂的城市和环境管理问题通常需要深入的领域科学和信息学专业知识。这些专业知识对于从数据和模拟中获得信息以支持明智的决策至关重要。本文探讨了利用预训练的大语言模型(LLM)的潜力。通过采用ChatGPT API作为推理核心,我们概述了一个集成的流程,包括自然语言处理、基于方法论的提示调优和transformers。该流程使用现有的研究文章以及城市数据集和模拟的技术手册,自动创建基于场景的本体。我们方法的结果是以广泛采用的本体语言(例如,OWL、RDF、SPARQL)表示的知识图谱。这些知识图谱通过增强数据和元数据建模、集成复杂数据集、耦合多领域模拟模型以及制定决策指标和工作流程,促进了城市决策支持系统的开发。通过将我们的人工智能生成的本体与流行的本体软件(例如,protégé)教程中使用的著名Pizza Ontology进行对比分析,评估了我们方法的可行性。最后,通过生成各种领域数据和模拟的文集来支持知情决策,我们以优化多式联运的复杂城市系统为例,进行了真实的案例研究。

🔬 方法详解

问题定义:论文旨在解决城市决策支持系统构建过程中对领域知识的依赖问题。现有方法需要大量人工干预,成本高,效率低,难以快速适应新的城市问题和数据。现有本体构建方法难以有效利用大规模的非结构化文本数据(如研究论文和技术手册)。

核心思路:论文的核心思路是利用预训练的大语言模型(LLM)的强大自然语言理解和生成能力,自动从非结构化文本中提取领域知识,并将其转化为结构化的本体。通过提示工程(prompt engineering)和知识图谱构建技术,将LLM的输出转化为可用于决策支持系统的知识表示。

技术框架:该方法包含以下主要模块:1) 自然语言处理:对输入的文本数据进行预处理,包括分词、词性标注、命名实体识别等。2) 基于方法论的提示调优:设计合适的提示(prompts),引导LLM提取所需的领域知识。3) Transformers:使用预训练的LLM(如ChatGPT API)作为推理核心,根据提示生成候选的本体元素。4) 本体构建:将LLM生成的候选元素进行整合、验证和修正,构建最终的本体,并将其表示为OWL、RDF、SPARQL等标准格式的知识图谱。

关键创新:该方法的主要创新在于利用LLM自动构建领域本体,显著降低了人工成本和时间。通过提示工程,可以灵活地控制LLM的输出,使其适应不同的领域和任务。此外,该方法还提出了一种将LLM与传统本体构建技术相结合的集成框架,充分发挥了二者的优势。

关键设计:论文采用ChatGPT API作为LLM的核心,通过精心设计的提示(prompts)来指导LLM提取领域知识。提示的设计需要考虑领域知识的特点和LLM的能力,以确保生成的本体的质量和完整性。论文还采用了基于方法论的提示调优方法,通过迭代优化提示,提高LLM的性能。具体参数设置和损失函数等技术细节在论文中未详细说明,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过与Pizza Ontology的对比分析,验证了AI生成本体的质量和可行性。案例研究表明,该方法可以有效地应用于多式联运的优化问题,为决策者提供有价值的知识支持。具体的性能数据和提升幅度在论文中未详细说明,属于未知信息。

🎯 应用场景

该研究成果可应用于智慧城市、环境管理、交通运输等领域。通过自动构建领域本体,可以为城市决策者提供更全面、更深入的知识支持,从而做出更明智的决策。该方法还可以用于构建特定领域的知识库,为科研人员和工程师提供便捷的知识获取途径。未来,该方法有望成为构建下一代城市决策支持系统的关键技术。

📄 摘要(原文)

The incorporation of Artificial Intelligence (AI) models into various optimization systems is on the rise. Yet, addressing complex urban and environmental management problems normally requires in-depth domain science and informatics expertise. This expertise is essential for deriving data and simulation-driven for informed decision support. In this context, we investigate the potential of leveraging the pre-trained Large Language Models (LLMs). By adopting ChatGPT API as the reasoning core, we outline an integrated workflow that encompasses natural language processing, methontology-based prompt tuning, and transformers. This workflow automates the creation of scenario-based ontology using existing research articles and technical manuals of urban datasets and simulations. The outcomes of our methodology are knowledge graphs in widely adopted ontology languages (e.g., OWL, RDF, SPARQL). These facilitate the development of urban decision support systems by enhancing the data and metadata modeling, the integration of complex datasets, the coupling of multi-domain simulation models, and the formulation of decision-making metrics and workflow. The feasibility of our methodology is evaluated through a comparative analysis that juxtaposes our AI-generated ontology with the well-known Pizza Ontology employed in tutorials for popular ontology software (e.g., protégé). We close with a real-world case study of optimizing the complex urban system of multi-modal freight transportation by generating anthologies of various domain data and simulations to support informed decision-making.