Generative Ontology: When Structured Knowledge Learns to Create
作者: Benny Cheung
分类: cs.AI, cs.CL
发布日期: 2026-02-05
备注: 15 pages, 6 figures, 6 tables. Code available at https://github.com/bennycheung/GameGrammarCLI
💡 一句话要点
提出生成式本体框架,融合本体知识与大语言模型创造力,实现结构化内容生成。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 生成式本体 大型语言模型 知识图谱 结构化生成 多智能体系统
📋 核心要点
- 现有本体知识库缺乏生成新颖内容的能力,而大语言模型生成的内容缺乏结构有效性,容易产生幻觉。
- 提出生成式本体框架,利用本体作为语法约束LLM的生成过程,结合检索增强生成和多智能体协作,实现结构化和创造性的内容生成。
- 通过GameGrammar系统生成完整的桌面游戏设计,验证了框架的有效性,并表明该方法可以推广到其他领域。
📝 摘要(中文)
传统本体擅长描述领域结构,但无法生成新颖内容。大型语言模型生成流畅,但缺乏结构有效性,容易产生幻觉。我们提出了生成式本体,一个综合两者优势的框架:本体提供语法,大语言模型提供创造力。生成式本体将领域知识编码为可执行的Pydantic模式,通过DSPy签名约束LLM生成。多智能体流水线将专业角色分配给不同的本体领域:机制架构师设计游戏系统,主题编织者整合叙事,平衡评论家识别漏洞。每个智能体都带有专业“焦虑”,防止产生浅薄的输出。检索增强生成将新颖设计建立在现有范例的基础上,而迭代验证确保机制和组件之间的一致性。我们通过GameGrammar系统展示了该框架,该系统用于生成完整的桌面游戏设计。给定一个主题提示(“在洞穴生态系统中竞争的生物发光真菌”),该流水线生成结构完整、可玩的游戏规范,包括机制、组件、胜利条件和设置说明。这些输出满足本体约束,同时保持真正的创造性。该模式可以推广到游戏之外。任何具有专家词汇、有效性约束和累积范例的领域(音乐创作、软件架构、烹饪艺术)都是生成式本体的候选者。我们认为约束不会限制创造力,而是会启用它:正如语法使诗歌成为可能一样,本体使结构化生成成为可能。
🔬 方法详解
问题定义:论文旨在解决现有本体知识库无法生成新颖内容,以及大型语言模型生成内容缺乏结构有效性的问题。现有方法要么过于依赖预定义的结构,缺乏创造性;要么过于自由,生成的内容不符合领域知识和约束。
核心思路:论文的核心思路是将本体作为一种“语法”,约束大型语言模型的生成过程。通过将领域知识编码为可执行的Pydantic模式,并利用DSPy签名来引导LLM的生成,确保生成的内容符合预定义的结构和约束。同时,利用LLM的创造力来生成新颖的内容,并结合检索增强生成和多智能体协作来提高生成质量。
技术框架:整体框架是一个多智能体流水线,包含以下主要模块:1) 机制架构师:负责设计游戏机制;2) 主题编织者:负责整合叙事主题;3) 平衡评论家:负责识别游戏漏洞。每个智能体都配备了特定的“焦虑”,以防止生成过于简单或平庸的内容。此外,框架还包括检索增强生成模块,用于从现有范例中检索相关信息,以及迭代验证模块,用于确保生成的内容在机制和组件之间保持一致性。
关键创新:论文的关键创新在于将本体作为一种“生成语法”,用于约束大型语言模型的生成过程。这种方法既保证了生成内容的结构有效性,又保留了LLM的创造力。此外,多智能体协作和检索增强生成也提高了生成质量。
关键设计:论文使用Pydantic模式来定义本体结构,并使用DSPy签名来约束LLM的生成。每个智能体都配备了特定的“焦虑”,这是一种损失函数,用于鼓励智能体生成更具挑战性和创新性的内容。检索增强生成模块使用余弦相似度来检索与输入提示相关的范例。
🖼️ 关键图片
📊 实验亮点
论文通过GameGrammar系统展示了该框架的有效性。给定一个主题提示,该系统可以生成结构完整、可玩的游戏规范,包括机制、组件、胜利条件和设置说明。这些输出不仅满足本体约束,而且具有真正的创造性,表明该框架能够有效地融合本体知识和LLM的创造力。
🎯 应用场景
该研究具有广泛的应用前景,可以应用于任何具有专家词汇、有效性约束和累积范例的领域,例如音乐创作、软件架构、烹饪艺术等。它可以帮助人们更高效地生成结构化、高质量的内容,并促进创新。
📄 摘要(原文)
Traditional ontologies excel at describing domain structure but cannot generate novel artifacts. Large language models generate fluently but produce outputs that lack structural validity, hallucinating mechanisms without components, goals without end conditions. We introduce Generative Ontology, a framework that synthesizes these complementary strengths: ontology provides the grammar; the LLM provides the creativity. Generative Ontology encodes domain knowledge as executable Pydantic schemas that constrain LLM generation via DSPy signatures. A multi-agent pipeline assigns specialized roles to different ontology domains: a Mechanics Architect designs game systems, a Theme Weaver integrates narrative, a Balance Critic identifies exploits. Each agent carrying a professional "anxiety" that prevents shallow, agreeable outputs. Retrieval-augmented generation grounds novel designs in precedents from existing exemplars, while iterative validation ensures coherence between mechanisms and components. We demonstrate the framework through GameGrammar, a system for generating complete tabletop game designs. Given a thematic prompt ("bioluminescent fungi competing in a cave ecosystem"), the pipeline produces structurally complete, playable game specifications with mechanisms, components, victory conditions, and setup instructions. These outputs satisfy ontological constraints while remaining genuinely creative. The pattern generalizes beyond games. Any domain with expert vocabulary, validity constraints, and accumulated exemplars (music composition, software architecture, culinary arts) is a candidate for Generative Ontology. We argue that constraints do not limit creativity but enable it: just as grammar makes poetry possible, ontology makes structured generation possible.