ElephantBroker: A Knowledge-Grounded Cognitive Runtime for Trustworthy AI Agents
作者: Cristian Lupascu, Alexandru Lupascu
分类: cs.AI
发布日期: 2026-03-26
💡 一句话要点
ElephantBroker:用于可信AI代理的知识驱动认知运行时
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 知识图谱 向量数据库 认知运行时 AI代理 可信AI 知识检索 安全防护
📋 核心要点
- 现有基于LLM的Agent在事实性知识存储和检索方面存在不足,缺乏对知识来源和可信度的追踪机制。
- ElephantBroker通过整合Neo4j知识图谱和Qdrant向量存储,构建可持久化、可验证的Agent记忆系统。
- 该系统实现了完整的认知循环,包含知识存储、检索、评分、组合、保护和学习等多个阶段,并进行了全面的测试验证。
📝 摘要(中文)
基于大型语言模型的代理越来越多地在高风险、多轮设置中运行,在这些设置中,事实依据至关重要。然而,它们的记忆系统通常依赖于扁平的键值存储或简单的向量检索,而没有机制来跟踪存储知识的来源或可信度。我们提出了ElephantBroker,一个开源认知运行时,它通过Cognee SDK统一了Neo4j知识图谱和Qdrant向量存储,以提供持久、可验证的代理记忆。该系统实现了一个完整的认知循环(存储、检索、评分、组合、保护、学习),包括一个混合的五源检索管道,一个用于预算约束上下文组装的十一维竞争评分引擎,一个四状态证据验证模型,一个具有目标感知组装和连续压缩的五阶段上下文生命周期,一个用于安全执行的六层廉价优先保护管道,一个提供可执行工具调用拦截和多层安全扫描的AI防火墙,一个加强有用模式同时衰减噪声的九阶段巩固引擎,以及一个管理具有分层访问控制的多组织身份的数字权限模型。通过包含超过2200个单元、集成和端到端级别测试的综合测试套件进行的架构验证证实了子系统的正确性。模块化设计支持三个部署层、五个具有继承的配置文件预设、多网关隔离以及用于人工监督的管理仪表板,从而能够实现从轻量级仅内存代理到具有企业级安全性和可审计性的完整认知运行时的配置。
🔬 方法详解
问题定义:现有基于大型语言模型的代理在需要事实依据的多轮交互场景中,其记忆系统依赖于扁平的键值存储或简单的向量检索,缺乏对存储知识的来源和可信度的有效追踪机制,导致代理可能产生不准确或不可靠的输出。
核心思路:ElephantBroker的核心思路是将知识图谱(Neo4j)和向量数据库(Qdrant)相结合,构建一个混合的知识存储和检索系统。知识图谱用于存储结构化的知识和实体关系,向量数据库用于存储非结构化的知识和语义信息。通过这种方式,系统可以同时利用结构化和非结构化知识,并追踪知识的来源和可信度。
技术框架:ElephantBroker的整体架构包含以下主要模块:1) 混合检索管道:包含五个知识来源,用于检索相关知识。2) 竞争评分引擎:基于十一个维度对检索到的知识进行评分,用于选择最佳上下文。3) 证据验证模型:对知识的可信度进行验证,包含四个状态。4) 上下文生命周期管理:包含五个阶段,用于管理上下文的组装和压缩。5) 安全防护管道:包含六层防护,用于确保系统的安全性。6) AI防火墙:用于拦截工具调用和进行多层安全扫描。7) 知识巩固引擎:包含九个阶段,用于加强有用模式并衰减噪声。8) 权限管理模型:用于管理多组织身份和分层访问控制。
关键创新:ElephantBroker的关键创新在于其混合知识表示和检索方法,以及对知识来源和可信度的追踪机制。通过将知识图谱和向量数据库相结合,系统可以同时利用结构化和非结构化知识,并提供更准确和可靠的知识检索结果。此外,系统还引入了证据验证模型和安全防护管道,以确保系统的安全性和可信度。
关键设计:ElephantBroker采用了模块化的设计,支持三个部署层和五个配置文件预设。系统还提供了多网关隔离和管理仪表板,用于人工监督和管理。在知识检索方面,系统采用了混合检索管道,包含多个知识来源,并使用竞争评分引擎选择最佳上下文。在安全方面,系统采用了多层安全防护机制,包括AI防火墙和安全防护管道。
📊 实验亮点
ElephantBroker通过包含超过2200个单元、集成和端到端级别测试的综合测试套件进行了架构验证,证实了子系统的正确性。该测试覆盖了系统的各个模块和功能,包括知识存储、检索、评分、组合、保护和学习等。测试结果表明,ElephantBroker能够有效地存储和检索知识,并提供准确和可靠的知识服务。
🎯 应用场景
ElephantBroker可应用于需要高可信度和可追溯性的AI代理场景,例如金融风控、医疗诊断、法律咨询等。该系统可以帮助AI代理提供更准确、可靠和可解释的决策,并提高用户对AI代理的信任度。未来,该系统可以进一步扩展到更多领域,并与其他AI技术相结合,构建更强大的AI应用。
📄 摘要(原文)
Large Language Model based agents increasingly operate in high stakes, multi turn settings where factual grounding is critical, yet their memory systems typically rely on flat key value stores or plain vector retrieval with no mechanism to track the provenance or trustworthiness of stored knowledge. We present ElephantBroker, an open source cognitive runtime that unifies a Neo4j knowledge graph with a Qdrant vector store through the Cognee SDK to provide durable, verifiable agent memory. The system implements a complete cognitive loop (store, retrieve, score, compose, protect, learn) comprising a hybrid five source retrieval pipeline, an eleven dimension competitive scoring engine for budget constrained context assembly, a four state evidence verification model, a five stage context lifecycle with goal aware assembly and continuous compaction, a six layer cheap first guard pipeline for safety enforcement, an AI firewall providing enforceable tool call interception and multi tier safety scanning, a nine stage consolidation engine that strengthens useful patterns while decaying noise, and a numeric authority model governing multi organization identity with hierarchical access control. Architectural validation through a comprehensive test suite of over 2,200 tests spanning unit, integration, and end to end levels confirms subsystem correctness. The modular design supports three deployment tiers, five profile presets with inheritance, multi gateway isolation, and a management dashboard for human oversight, enabling configurations from lightweight memory only agents to full cognitive runtimes with enterprise grade safety and auditability.