GLiNER-Relex: A Unified Framework for Joint Named Entity Recognition and Relation Extraction
作者: Ihor Stepanov, Oleksandr Lukashov, Mykhailo Shtopko, Vivek Kalyanarangan
分类: cs.CL, cs.LG
发布日期: 2026-05-11
备注: 19 pages, 1 figure, 2 tables
💡 一句话要点
提出GLiNER-Relex统一框架,实现命名实体识别与关系抽取的零样本联合建模
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 命名实体识别 关系抽取 零样本学习 知识图谱 统一框架 Transformer编码器 自然语言处理
📋 核心要点
- 现有NER与RE任务通常依赖独立模型,导致流程割裂且难以处理推理时动态定义的实体与关系类型。
- 提出GLiNER-Relex统一框架,利用共享Transformer编码器联合表征文本与标签,实现零样本实体与关系抽取。
- 在多个主流数据集上验证了其有效性,在保持计算高效性的同时,性能媲美专用模型及大语言模型。
📝 摘要(中文)
命名实体识别(NER)与关系抽取(RE)是构建知识图谱的核心任务。现有方法通常将两者视为独立任务,依赖特定模型,缺乏灵活性。本文提出了GLiNER-Relex,这是一个基于GLiNER框架的统一架构,能够在单一模型中同时执行实体识别与关系抽取。该方法利用共享的双向Transformer编码器,对文本、实体类型标签和关系类型标签进行联合表征,从而支持在推理阶段对任意指定的实体和关系类型进行零样本抽取。GLiNER-Relex通过识别出的跨度(span)构建实体对表征,并利用专门的关系评分模块将其与关系类型嵌入进行匹配。在CoNLL04、DocRED、FewRel和CrossRE四个标准基准测试中,该模型表现出与专用RE模型及大语言模型相当的竞争力,同时保持了GLiNER家族高效的计算性能。相关代码与模型已开源。
🔬 方法详解
问题定义:论文旨在解决非结构化文本中实体识别与关系抽取任务的解耦问题。现有方法通常需要针对特定标签集进行训练,无法灵活应对推理时出现的新类型,且多阶段流水线导致了误差传播和计算冗余。
核心思路:基于GLiNER框架,将NER和RE统一建模。通过将实体和关系类型标签转化为向量表征,使模型能够理解并匹配任意类型的语义,从而实现零样本(Zero-shot)预测能力。
技术框架:整体架构基于双向Transformer编码器。首先,模型对输入文本及动态输入的实体/关系标签进行联合编码;其次,通过跨度检测模块识别实体;最后,利用关系评分模块对识别出的实体对进行打分,判断其是否存在特定关系。
关键创新:引入了统一的标签嵌入空间,使得模型不再受限于预定义的标签集。通过共享编码器实现了NER与RE的深度耦合,显著提升了跨任务的信息交互效率。
关键设计:采用基于跨度(span-based)的表示方法,将实体对的特征与关系类型嵌入进行点积或相似度计算,从而在推理阶段灵活地通过标签语义匹配完成关系分类,无需重新训练模型。
🖼️ 关键图片
📊 实验亮点
GLiNER-Relex在CoNLL04、DocRED、FewRel和CrossRE四个基准测试中表现出色。实验结果表明,该模型在零样本场景下不仅能够达到甚至超越部分专用RE模型的性能,且在推理速度和资源占用上显著优于大语言模型,证明了其在实际生产环境中的高效性与鲁棒性。
🎯 应用场景
该技术在知识图谱自动化构建、智能文档处理、医疗记录分析及法律文本挖掘等领域具有广泛应用价值。其零样本特性使其能够快速适应新领域,无需大规模标注数据即可部署,极大降低了企业级NLP应用的开发与维护成本。
📄 摘要(原文)
Joint named entity recognition (NER) and relation extraction (RE) is a fundamental task in natural language processing for constructing knowledge graphs from unstructured text. While recent approaches treat NER and RE as separate tasks requiring distinct models, we introduce GLiNER-Relex, a unified architecture that extends the GLiNER framework to perform both entity recognition and relation extraction in a single model. Our approach leverages a shared bidirectional transformer encoder to jointly represent text, entity type labels, and relation type labels, enabling zero-shot extraction of arbitrary entity and relation types specified at inference time. GLiNER-Relex constructs entity pair representations from recognized spans and scores them against relation type embeddings using a dedicated relation scoring module. We evaluate our model on four standard relation extraction benchmarks: CoNLL04, DocRED, FewRel, and CrossRE, and demonstrate competitive performance against both specialized relation extraction models and large language models, while maintaining the computational efficiency characteristic of the GLiNER family. The model is released as an open-source Python package with a simple inference API that allows users to specify arbitrary entity and relation type labels at inference time and obtain both entities and relation triplets in a single call. All models and code are publicly available.