Harnessing Structural Context for Entity Alignment Foundation Models

📄 arXiv: 2606.06109v1 📥 PDF

作者: Xingyu Chen, Yuanning Cui, Zequn Sun, Wei Hu

分类: cs.CL, cs.AI

发布日期: 2026-06-04


💡 一句话要点

提出ContextEA以解决知识图谱实体对齐中的结构上下文不足问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 实体对齐 知识图谱 跨KG推理 结构上下文 深度学习 迁移学习

📋 核心要点

  1. 现有的EA基础模型在跨KG交互和候选排名方面存在结构上下文利用不足的问题。
  2. 本文提出ContextEA,通过跨KG交互编码器和结构校准解码器来增强结构上下文的构建与利用。
  3. 在29个EA数据集上,ContextEA的预训练模型在所有基准组中均超越了微调基线,显示出更强的迁移能力。

📝 摘要(中文)

实体对齐(EA)旨在识别异构知识图谱(KGs)中的等效实体,是知识融合和跨KG推理的关键组成部分。近期的EA基础模型表明,预训练的对齐知识可以直接应用于多种未见过的KG对。然而,该模型在两个方面仍然未能充分利用结构上下文:在编码过程中跨KG交互较弱,最终候选排名过于依赖粗略相似度。为了解决这些局限性,本文提出了ContextEA,一个增强的编码器-解码器框架,用于可转移的EA。通过引入跨KG交互编码器和结构校准解码器,增强了结构上下文的构建与利用。实验结果表明,ContextEA在29个EA数据集上均表现出显著的性能提升。

🔬 方法详解

问题定义:本文旨在解决现有EA模型在跨KG交互和候选排名中对结构上下文的不足利用问题。现有方法在编码阶段未能有效捕捉KG之间的关系,导致对齐效果不佳。

核心思路:ContextEA通过引入跨KG交互编码器和结构校准解码器,旨在增强结构上下文的构建与利用,从而提升实体对齐的准确性和效率。

技术框架:ContextEA的整体架构包括两个主要模块:跨KG交互编码器和结构校准解码器。编码器通过锚桥统一两个KG,并进行关系感知的跨图传播;解码器则利用多层次的结构证据来校准对齐分数。

关键创新:最重要的创新在于引入了关系感知的跨KG交互机制和多层次的结构校准方法,这与现有方法主要依赖于粗略相似度的做法有本质区别。

关键设计:在设计上,跨KG交互编码器通过锚桥实现KG的统一,结构校准解码器则结合实体级、邻域级、关系级和锚点感知的结构证据来优化对齐分数,确保模型在保持轻量的同时增强性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在29个EA数据集的实验中,ContextEA的预训练模型在所有基准组中均超过了微调的基线,显示出显著的性能提升,尤其是在未见过的KG对上,表现出更强的迁移能力。

🎯 应用场景

该研究的潜在应用领域包括知识图谱的构建与融合、信息检索、推荐系统等。通过提高实体对齐的准确性,ContextEA能够在多种实际场景中提升数据整合和知识推理的效率,具有重要的实际价值和未来影响。

📄 摘要(原文)

Entity alignment (EA) aims to identify equivalent entities across heterogeneous knowledge graphs (KGs) and is a key component of knowledge fusion and cross-KG reasoning. The recent EA foundation model demonstrates that alignment knowledge, once pretrained, can be directly applied to diverse previously unseen KG pairs. However, it still underuses structural context in two places: cross-KG interaction is weak during encoding, and final candidate ranking still relies too heavily on coarse similarity. We address these limitations with ContextEA, an enhanced encoder-decoder framework for transferable EA. On the encoder side, we introduce a cross-KG interaction encoder that unifies the two KGs with anchor bridges and performs earlier relation-aware cross-graph propagation. On the decoder side, we introduce a structural calibration decoder that calibrates alignment scores with entity-level, neighborhood-level, relation-level, and anchor-aware structural evidence. This design strengthens both structural context construction and structural context exploitation while remaining lightweight. Experiments on 29 EA datasets in OpenEA, SRPRS, and DBP show consistent gains over strong transferable baselines. Notably, the pretrained ContextEA already surpasses the finetuned baselines on all three benchmark groups, demonstrating substantially stronger transfer to unseen KGs. These results suggest that explicitly harnessing structural context is an effective direction for improving EA foundation models.