OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources

📄 arXiv: 2605.29250v1 📥 PDF

作者: Jinheon Baek, Soyeong Jeong, Sangwoo Park, Woongyeong Yeo, Minki Kang, Patara Trirat, Heejun Lee, Sung Ju Hwang

分类: cs.CL, cs.AI, cs.IR, cs.LG

发布日期: 2026-05-28


💡 一句话要点

OmniRetrieval:统一异构知识源的检索框架

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 异构数据检索 知识源识别 自然语言查询 语义解析 多模态数据

📋 核心要点

  1. 现有检索方法难以统一处理文本、关系表、知识图谱等异构知识源,缺乏通用接口。
  2. OmniRetrieval框架通过识别知识源并分派源原生查询,实现了异构知识源的统一检索。
  3. 实验结果表明,OmniRetrieval在多个数据集上超越了单源基线,验证了其有效性。

📝 摘要(中文)

现实世界的信息需求需要访问结构多样的知识源,包括非结构化文本、关系表、知识图谱和属性图。然而,现有的检索器一次只能在一个源上操作,并且使用固定的查询语言,使得更广泛的可用知识因不兼容的接口而支离破碎。一种自然的统一尝试是将这些源折叠到一个共享空间中,但这会消除结构上的优势(例如模式、本体、组合运算符),而这些优势赋予了每个源的表达能力。因此,对多样化知识的有效检索,需要的不是同质化,而是一个总体的层,以其自身的条件满足每个源。为了实现这一点,我们提出了OmniRetrieval,一个框架,它接受任何自然语言查询,识别合适的知识源,并将源原生查询分派到其原生执行引擎。在一个广泛的基准测试中,涵盖了13个数据集和309个不同的知识库,包括文本、关系和图结构源,OmniRetrieval超过了单源基线,证明它可以作为异构源的通用接口,同时保留使每个源有价值的结构区别。

🔬 方法详解

问题定义:现有检索系统通常针对单一类型的知识源设计,例如文本、关系数据库或知识图谱。这导致用户需要针对不同的数据源使用不同的查询语言和工具,增加了使用成本和复杂度。此外,将所有数据源统一到一个共享空间会丢失每个数据源固有的结构信息,降低检索效率。

核心思路:OmniRetrieval的核心思路是不对异构知识源进行同质化处理,而是构建一个统一的框架,能够识别用户查询对应的知识源,并将查询转换为该知识源的原生查询语言。这样既能利用每个知识源的结构信息,又能提供一个统一的检索接口。

技术框架:OmniRetrieval框架包含以下几个主要模块:1) 知识源识别模块:根据用户查询,判断哪些知识源可能包含相关信息。2) 查询转换模块:将用户查询转换为每个知识源的原生查询语言,例如SQL、SPARQL等。3) 查询执行模块:将转换后的查询发送到相应的知识源执行引擎。4) 结果整合模块:将来自不同知识源的查询结果进行整合,并返回给用户。

关键创新:OmniRetrieval的关键创新在于其能够处理异构知识源,并利用每个知识源的结构信息进行检索。与现有方法相比,OmniRetrieval不需要将所有数据源统一到一个共享空间,从而避免了信息丢失和效率降低的问题。

关键设计:知识源识别模块可以使用分类模型,根据查询文本的特征进行分类。查询转换模块可以使用预训练的语言模型进行语义解析,将自然语言查询转换为目标查询语言。结果整合模块需要考虑不同知识源的数据格式和语义差异,可以使用知识图谱等技术进行对齐和融合。具体的参数设置、损失函数、网络结构等细节取决于具体的实现方式,论文中可能未详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

OmniRetrieval在包含13个数据集和309个知识库的广泛基准测试中进行了评估,这些知识库涵盖文本、关系和图结构数据。实验结果表明,OmniRetrieval显著优于单源基线方法,证明了其在异构知识源检索方面的有效性。具体的性能提升数据在论文中进行了详细展示。

🎯 应用场景

OmniRetrieval可应用于智能问答系统、企业知识管理、科研数据检索等领域。它能够帮助用户从各种异构数据源中快速准确地获取所需信息,提高工作效率和决策质量。未来,该技术有望进一步扩展到更多类型的知识源,并支持更复杂的查询和推理。

📄 摘要(原文)

Real-world information needs require access to structurally diverse knowledge sources, from unstructured text and relational tables to knowledge graphs and property graphs. Existing retrievers, however, operate over one source at a time under a fixed query language, leaving the broader landscape of available knowledge fragmented behind incompatible interfaces. A natural attempt at unification would collapse these sources into a shared space, but this erases the structural affordances (such as schemas, ontologies, compositional operators) that give each source its expressive power. Effective retrieval over diverse knowledge, therefore, requires not homogenization but an overarching layer that meets each source on its own terms. To achieve this, we present OmniRetrieval, a framework that takes any natural-language query, identifies appropriate knowledge sources, and dispatches source-native queries to their native execution engines. Across an extensive benchmark spanning 13 datasets and 309 distinct knowledge bases over text, relational, and graph-structured sources, OmniRetrieval exceeds single-source baselines, demonstrating that it can serve as a general-purpose interface to the heterogeneous sources while preserving the structural distinctions that make each source valuable.