GEAKG: Generative Executable Algorithm Knowledge Graphs

📄 arXiv: 2603.27922v1 📥 PDF

作者: Camilo Chacón Sartori, José H. García, Andrei Voicu Tomut, Christian Blum

分类: cs.AI, cs.IR

发布日期: 2026-03-30


💡 一句话要点

提出GEAKG:一种生成式可执行算法知识图谱,实现跨领域算法知识的表示、学习与迁移。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 知识图谱 算法设计 程序性知识 零样本迁移 蚁群优化 大型语言模型 可执行图

📋 核心要点

  1. 现有算法设计中,程序性知识隐式存在于代码中,难以复用和迁移,导致每个新领域都需要重新设计。
  2. GEAKG通过将可执行算子存储在节点中,将组合模式编码在边中,利用图遍历生成解决方案,显式表示算法知识。
  3. 实验表明,GEAKG在神经架构搜索和组合优化问题上,能够实现跨领域的零样本迁移,验证了其有效性。

📝 摘要(中文)

本文提出了一种新的知识图谱(KG)范式——生成式可执行算法知识图谱(GEAKG),旨在解决算法设计和算子组合中的程序性知识隐式存在于代码中,在运行间丢失,并且必须为每个新领域重新设计的问题。GEAKG的节点存储可执行算子,边编码学习到的组合模式,图的遍历生成解决方案。GEAKG是生成式的(拓扑和算子由大型语言模型合成),可执行的(每个节点都是可运行的代码),并且可迁移的(学习到的模式可以零样本泛化到不同领域)。该框架在引擎级别是领域无关的:相同的三层架构和基于蚁群优化(ACO)的学习引擎可以在不同领域实例化,并通过可插拔的本体(RoleSchema)进行参数化。两个案例研究——不共享任何领域特定的框架代码——为这个框架假设提供了具体的证据:(1)在两个表格基准测试上跨70个跨数据集迁移对的神经架构搜索,以及(2)组合优化,其中在旅行商问题上学习的知识零样本迁移到调度和分配领域。总而言之,结果表明算法专业知识可以被显式地表示、学习和迁移为可执行的知识图谱。

🔬 方法详解

问题定义:现有算法知识表示方法难以显式地表达算法设计和算子组合的程序性知识,导致知识无法在不同领域之间有效迁移和复用。每次面对新的问题领域,都需要重新进行算法设计和优化,效率低下。现有知识图谱范式对程序性知识的支持有限,无法直接表示可执行的算法流程。

核心思路:GEAKG的核心思路是将算法知识表示为可执行的知识图谱,其中节点代表可执行的算子,边代表算子之间的组合关系。通过学习图的结构和节点上的算子,可以获得算法设计的知识。这种表示方法使得算法知识可以被显式地表达、学习和迁移。利用大型语言模型生成图的拓扑结构和节点上的算子,使得GEAKG具有生成能力。

技术框架:GEAKG框架包含三个主要层次:(1)知识图谱层:存储可执行的算子和它们之间的组合关系。(2)学习引擎层:使用蚁群优化(ACO)算法学习图的结构和节点上的算子。(3)领域本体层:使用可插拔的本体(RoleSchema)来描述特定领域的知识,从而实现领域无关性。整个框架通过大型语言模型进行初始化,然后通过ACO算法进行优化。

关键创新:GEAKG的关键创新在于将知识图谱的概念扩展到可执行的算法领域,使得算法知识可以被显式地表示和学习。通过结合大型语言模型和蚁群优化算法,GEAKG能够自动生成和优化算法知识图谱。此外,GEAKG的领域无关性设计使得它可以应用于不同的问题领域,实现跨领域的知识迁移。

关键设计:GEAKG使用三层架构,其中RoleSchema定义了领域相关的本体知识,用于指导大型语言模型生成初始的知识图谱。ACO算法用于优化图的结构和节点上的算子,其参数设置包括信息素挥发率、启发式因子等。损失函数的设计需要考虑算法的性能和图的复杂度,例如可以使用算法的运行时间和图的节点数量作为损失函数的组成部分。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,GEAKG在神经架构搜索和组合优化问题上都取得了显著的成果。在神经架构搜索方面,GEAKG在70个跨数据集迁移对上进行了测试,结果表明GEAKG能够实现零样本迁移。在组合优化方面,GEAKG在旅行商问题上学习的知识可以零样本迁移到调度和分配领域。

🎯 应用场景

GEAKG具有广泛的应用前景,例如自动化算法设计、跨领域知识迁移、智能决策支持等。它可以应用于各种需要算法解决的问题,例如组合优化、机器学习、数据挖掘等。通过学习和迁移算法知识,GEAKG可以帮助人们更高效地解决问题,并发现新的算法。

📄 摘要(原文)

In the context of algorithms for problem solving, procedural knowledge -- the know-how of algorithm design and operator composition -- remains implicit in code, lost between runs, and must be re-engineered for each new domain. Knowledge graphs (KGs) have proven effective for organizing declarative knowledge, yet current KG paradigms provide limited support for representing procedural knowledge as executable, learnable graph structures. We introduce \textit{Generative Executable Algorithm Knowledge Graphs} (GEAKG), a class of KGs whose nodes store executable operators, whose edges encode learned composition patterns, and whose traversal generates solutions. A GEAKG is \emph{generative} (topology and operators are synthesized by a Large Language Model), \emph{executable} (every node is runnable code), and \emph{transferable} (learned patterns generalize zero-shot across domains). The framework is domain-agnostic at the engine level: the same three-layer architecture and Ant Colony Optimization (ACO)-based learning engine can be instantiated across domains, parameterized by a pluggable ontology (\texttt{RoleSchema}). Two case studies -- sharing no domain-specific framework code -- provide concrete evidence for this framework hypothesis: (1)~Neural Architecture Search across 70 cross-dataset transfer pairs on two tabular benchmarks, and (2)~Combinatorial Optimization, where knowledge learned on the Traveling Salesman Problem transfers zero-shot to scheduling and assignment domains. Taken together, the results support that algorithmic expertise can be explicitly represented, learned, and transferred as executable knowledge graphs.