Knowledge Graph Re-engineering Along the Ontological Continuum (extended version)

📄 arXiv: 2605.22093v1 📥 PDF

作者: Enrico Daga, Valentina Tamma, Terry Payne

分类: cs.AI

发布日期: 2026-05-21


💡 一句话要点

提出本体连续体概念,用于知识图谱重构以适应神经符号AI需求

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 知识图谱 本体工程 神经符号AI 数据集成 形式概念分析

📋 核心要点

  1. 现有知识图谱建模方法多样,导致集成和重用困难,尤其是在神经符号AI中。
  2. 论文提出“本体连续体”概念,通过语义/语用和属性/可供性两个维度来描述和转换知识图谱。
  3. 通过溯源知识的案例研究验证了该理论框架,并提出了五个开放的研究挑战。

📝 摘要(中文)

知识图谱已成为数据集成的主要工具,对现代人工智能的成功至关重要。然而,从轻量级词汇表到富含公理的本体,KG建模实践的多样性使得集成和重用成本高昂且脆弱。神经符号AI中,弥合神经和符号组件依赖于KG重构以适应新需求的能力,这一挑战尤为突出。生成式AI提供了前所未有的自动化能力,但缺乏对KG空间的原则性理解,这种自动化在概念上仍然没有基础。我们引入本体连续体作为缺失的概念化,这是一个理论结构,其特征框架由两个正交区分定义:语义与语用,以及属性与可供性。它们共同定义了一个词汇表,用于描述、比较、导航和转换各种建模实践中的KG。方法论立场是经验性的:连续体并非规定KG应该如何建模,而是旨在定义一种基于对真实世界KG工程实践的观察而得出的现有理论,其结构可以通过形式概念分析(FCA)等方式进行形式化显式表达。我们通过一个关于溯源知识的案例研究来阐明这一愿景,展示了单个关注点如何在连续体中以不同的方式体现。我们阐述了五个开放的研究挑战,并邀请社区开发本体连续体作为共享的研究议程。

🔬 方法详解

问题定义:现有知识图谱建模实践差异巨大,从简单的词汇表到复杂的本体,这使得知识图谱的集成和重用变得困难且容易出错。特别是在神经符号AI领域,需要根据不同的需求对知识图谱进行重构,而现有的方法缺乏一个统一的理论框架来指导这种重构。

核心思路:论文的核心思路是引入“本体连续体”的概念,将不同的知识图谱建模方法视为位于一个连续体上的不同点。这个连续体由两个正交的维度定义:语义与语用,以及属性与可供性。通过这两个维度,可以对不同的知识图谱建模方法进行比较、描述和转换。这样设计的目的是为了提供一个统一的理论框架,从而更好地理解和管理知识图谱的多样性。

技术框架:论文提出的技术框架主要包括以下几个部分:1)定义本体连续体的概念,并使用语义/语用和属性/可供性两个维度对其进行描述。2)通过观察现实世界的知识图谱工程实践,对本体连续体进行经验性的验证。3)使用形式概念分析(FCA)等方法,将本体连续体的结构进行形式化显式表达。4)通过案例研究,展示如何使用本体连续体来理解和转换不同的知识图谱建模方法。

关键创新:论文最重要的技术创新点是提出了“本体连续体”的概念,并将其应用于知识图谱的重构。与现有方法相比,该方法提供了一个统一的理论框架,可以更好地理解和管理知识图谱的多样性。此外,该方法还强调了经验性的验证,通过观察现实世界的知识图谱工程实践来改进理论框架。

关键设计:论文的关键设计在于两个维度的选择:语义与语用,以及属性与可供性。语义维度关注知识图谱的内在含义,而语用维度关注知识图谱在实际应用中的作用。属性维度关注知识图谱的静态特征,而可供性维度关注知识图谱可以提供的功能。这两个维度的结合可以全面地描述知识图谱的特征,并为知识图谱的重构提供指导。

📊 实验亮点

论文通过溯源知识的案例研究,展示了本体连续体在理解和转换不同知识图谱建模方法方面的有效性。虽然论文没有提供具体的性能数据,但该案例研究为本体连续体的应用提供了有力的支持,并为未来的研究方向提供了指导。

🎯 应用场景

该研究成果可应用于神经符号AI、数据集成、知识图谱管理等领域。通过本体连续体,可以更好地理解和转换不同的知识图谱建模方法,从而降低集成成本,提高知识图谱的重用性。未来,该研究有望推动知识图谱在更多领域的应用。

📄 摘要(原文)

Knowledge graphs have become the primary vehicle for data integration and are critical to the success of modern AI, but the diversity of KG modelling practices, from lightweight vocabularies to richly axiomatised ontologies, makes integration and reuse expensive and brittle. This challenge is particularly acute in neuro-symbolic AI, where bridging neural and symbolic components depends on the ability to reengineer KGs to fit new requirements; GenAI now offers unprecedented automation capability, but without a principled understanding of the KG space, such automation remains conceptually ungrounded. We introduce the ontological continuum as that missing conceptualisation, a theoretical construct a theoretical construct whose characterisation framework is defined by two orthogonal distinctions: semantics vs pragmatics, and properties vs affordances; together these define a vocabulary to describe, compare, navigate, and transform KGs across the full range of modelling practices. The methodological stance is empirical: rather than prescribing how KGs should be modelled, the continuum aims to define a theory of the existent, derived from observation of real-world KG engineering practices and whose structure can be made formally explicit, for example, through Formal Concept Analysis (FCA). We ground the vision through a case study on provenance knowledge, showing how a single concern manifests differently across the continuum. We articulate five open research challenges and invite the community to develop the ontological continuum as a shared research agenda.