GRASP: Generic Reasoning And SPARQL Generation across Knowledge Graphs

📄 arXiv: 2507.08107v2 📥 PDF

作者: Sebastian Walter, Hannah Bast

分类: cs.CL, cs.DB, cs.IR

发布日期: 2025-07-10 (更新: 2026-01-09)

备注: Accepted for publication at ISWC 2025. This version of the contribution has been accepted for publication, after peer review but is not the Version of Record. The Version of Record is available online at: https://doi.org/10.1007/978-3-032-09527-5_15

期刊: The Semantic Web - ISWC 2025, LNCS 16140, pp. 271-289 (2026)

DOI: 10.1007/978-3-032-09527-5_15


💡 一句话要点

提出GRASP,利用大语言模型零样本生成SPARQL查询,提升知识图谱问答性能。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 知识图谱问答 SPARQL生成 大型语言模型 零样本学习 图探索

📋 核心要点

  1. 现有方法在知识图谱问答中通常需要大量标注数据进行微调,泛化能力受限。
  2. GRASP利用大语言模型在知识图谱中探索,通过执行SPARQL查询寻找相关信息,无需微调。
  3. 实验表明,GRASP在Wikidata上零样本达到SOTA,Freebase上接近最佳少样本方法。

📝 摘要(中文)

本文提出了一种新的方法,利用大型语言模型从自然语言问题或关键词查询生成RDF知识图谱上的SPARQL查询。该方法无需微调,而是利用语言模型通过策略性地执行SPARQL查询并搜索相关的IRIs和字面量来探索知识图谱。我们在各种基准测试(针对不同类型和大小的知识图谱)和语言模型(不同规模和类型,包括商业和开源)上评估了我们的方法,并将其与现有方法进行了比较。在Wikidata上,尽管是零样本设置,但我们在多个基准测试中达到了最先进的结果。在Freebase上,我们接近了最佳的少样本方法。在其他不太常用的知识图谱和基准测试中,我们的方法也表现良好。我们进行了几项额外的研究,例如比较不同的图搜索方法,整合反馈机制,或利用少样本示例。

🔬 方法详解

问题定义:论文旨在解决从自然语言问题或关键词查询生成SPARQL查询,从而在RDF知识图谱上进行问答的问题。现有方法通常依赖于大量标注数据进行微调,这限制了它们在新的知识图谱上的泛化能力,并且微调过程本身也需要大量的计算资源。

核心思路:论文的核心思路是利用大型语言模型(LLM)的强大推理能力和知识储备,通过与知识图谱进行交互式探索来生成SPARQL查询。这种方法避免了对LLM进行微调的需求,使其能够以零样本或少样本的方式适应不同的知识图谱。

技术框架:GRASP的整体框架包含以下几个主要阶段:1) 问题编码:将自然语言问题输入到LLM中。2) 图探索:LLM根据问题生成SPARQL查询,并在知识图谱上执行。3) 信息提取:从查询结果中提取相关的IRIs和字面量。4) 查询构建:LLM根据提取的信息构建最终的SPARQL查询。5) 答案生成:执行最终的SPARQL查询,并返回答案。

关键创新:GRASP的关键创新在于其零样本的图探索方法。与传统的需要微调的方法不同,GRASP利用LLM的固有能力来理解问题并生成SPARQL查询,从而实现对知识图谱的探索。这种方法使得GRASP能够轻松地适应不同的知识图谱,而无需进行额外的训练。

关键设计:论文中涉及的关键设计包括:1) 图搜索策略:探索不同的图搜索策略,例如广度优先搜索和深度优先搜索,以找到最有效的探索路径。2) 反馈机制:整合反馈机制,允许LLM根据查询结果调整其搜索策略。3) 少样本示例:研究少样本示例对GRASP性能的影响。

🖼️ 关键图片

fig_0

📊 实验亮点

GRASP在Wikidata上实现了零样本SOTA,在多个基准测试中超越了现有方法。在Freebase上,GRASP的性能接近最佳的少样本方法。实验结果表明,GRASP能够有效地利用LLM的推理能力来探索知识图谱,并生成准确的SPARQL查询,即使在没有微调的情况下也能取得优异的性能。

🎯 应用场景

GRASP可应用于智能问答系统、知识图谱检索、语义搜索等领域。它降低了知识图谱问答系统的开发成本,提高了系统的泛化能力,使得用户能够更方便地从知识图谱中获取信息。未来,GRASP有望应用于更复杂的知识图谱推理任务。

📄 摘要(原文)

We propose a new approach for generating SPARQL queries on RDF knowledge graphs from natural language questions or keyword queries, using a large language model. Our approach does not require fine-tuning. Instead, it uses the language model to explore the knowledge graph by strategically executing SPARQL queries and searching for relevant IRIs and literals. We evaluate our approach on a variety of benchmarks (for knowledge graphs of different kinds and sizes) and language models (of different scales and types, commercial as well as open-source) and compare it with existing approaches. On Wikidata we reach state-of-the-art results on multiple benchmarks, despite the zero-shot setting. On Freebase we come close to the best few-shot methods. On other, less commonly evaluated knowledge graphs and benchmarks our approach also performs well overall. We conduct several additional studies, like comparing different ways of searching the graphs, incorporating a feedback mechanism, or making use of few-shot examples.