Empowering Heterogeneous Graph Foundation Models via Decoupled Relation Alignment
作者: Ziyu Zheng, Yaming Yang, Zhe Wang, Ziyu Guan, Wei Zhao
分类: cs.SI, cs.AI
发布日期: 2026-05-01
🔗 代码/项目: GITHUB
💡 一句话要点
提出解耦关系子空间对齐(DRSA)框架,提升异构图基础模型跨域知识迁移能力。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 异构图学习 图基础模型 跨域知识迁移 关系对齐 解耦表示
📋 核心要点
- 现有图基础模型在异构图上存在类型崩溃和关系混淆问题,无法有效进行跨域知识迁移。
- 提出解耦关系子空间对齐(DRSA)框架,将特征语义与关系结构解耦,在低秩关系子空间中进行对齐。
- 实验表明,DRSA能显著提升现有图基础模型在跨域和少样本学习任务上的性能。
📝 摘要(中文)
图基础模型(GFMs)在同构图上取得了显著成功,但将其扩展到多域异构图(MDHGs)仍然面临巨大挑战,主要由于跨类型特征偏移和域内关系差距。现有的全局特征对齐方法(PCA或SVD)盲目地强制执行共享特征空间,扭曲了类型特定的语义并破坏了原始拓扑结构,不可避免地导致“类型崩溃”和“关系混淆”。为了解决这些根本限制,我们提出了解耦关系子空间对齐(DRSA),这是一种新颖的、即插即用的关系驱动对齐框架。DRSA通过将特征语义与关系结构解耦,从根本上转变了范式。具体来说,它引入了一种双关系子空间投影机制,以显式地协调共享低秩关系子空间内的跨类型交互。此外,设计了一种特征-结构解耦表示,将对齐的特征分解为语义投影分量和结构残差项,自适应地吸收域内变化。DRSA通过基于块坐标下降的稳定交替最小化策略进行优化,构建了一个经过良好校准的、结构感知的潜在空间。在多个真实世界基准数据集上的大量实验表明,DRSA可以无缝地集成作为一个通用的预处理模块,显著且一致地增强了最先进的GFMs的跨域和少样本知识迁移能力。代码已发布。
🔬 方法详解
问题定义:现有的图基础模型在处理多域异构图时,由于不同类型的节点和边具有不同的特征分布,以及各个域内关系存在差异,直接进行特征对齐会导致“类型崩溃”(Type Collapse)和“关系混淆”(Relation Confusion)。这意味着模型无法区分不同类型的节点和关系,从而影响其在跨域知识迁移和少样本学习等任务上的表现。现有方法如PCA或SVD盲目地将所有特征投影到共享空间,忽略了异构图的固有结构和语义信息。
核心思路:DRSA的核心思路是将特征的语义信息与关系结构信息解耦。通过这种解耦,模型可以更好地处理不同类型节点和边的特征差异,同时保留各个域内的关系结构。具体来说,DRSA不是直接对原始特征进行对齐,而是首先将特征投影到一个低秩的关系子空间中,在这个子空间中进行对齐操作。这样可以减少特征对齐对原始特征语义的干扰,同时利用关系信息来指导对齐过程。
技术框架:DRSA框架主要包含以下几个模块:1) 双关系子空间投影机制:将不同类型的节点和边的特征投影到共享的低秩关系子空间中,从而协调跨类型交互。2) 特征-结构解耦表示:将对齐后的特征分解为语义投影分量和结构残差项,前者负责保留对齐后的语义信息,后者负责吸收域内变化。3) 优化策略:采用基于块坐标下降的交替最小化策略来优化模型参数,保证训练的稳定性和收敛性。
关键创新:DRSA的关键创新在于其解耦的思想和双关系子空间投影机制。与现有方法直接对原始特征进行对齐不同,DRSA将特征语义与关系结构解耦,从而避免了类型崩溃和关系混淆问题。双关系子空间投影机制允许模型在低秩空间中进行特征对齐,从而减少了计算复杂度,并提高了对齐的准确性。
关键设计:DRSA的关键设计包括:1) 低秩关系子空间:通过设置合适的秩,可以控制模型的复杂度和泛化能力。2) 语义投影分量和结构残差项:通过设计合适的损失函数,可以平衡语义信息的保留和结构信息的吸收。3) 块坐标下降优化策略:通过交替优化不同模块的参数,可以保证训练的稳定性和收敛性。具体的损失函数和网络结构细节在论文中有详细描述。
🖼️ 关键图片
📊 实验亮点
实验结果表明,DRSA作为一种通用的预处理模块,能够显著提升现有图基础模型在跨域和少样本学习任务上的性能。在多个真实世界基准数据集上,DRSA consistently 提高了模型在知识迁移任务上的准确率,并且在少样本学习场景下表现出更强的泛化能力。具体性能提升数据需要在论文中查找。
🎯 应用场景
DRSA可广泛应用于各种涉及多域异构图的场景,如跨平台推荐系统、多模态知识图谱融合、生物医学网络分析等。通过提升图基础模型的跨域知识迁移能力,DRSA能够帮助模型更好地理解和利用不同领域的数据,从而提高各种下游任务的性能。该研究为异构图学习领域提供了一种新的思路,具有重要的实际价值和潜在的未来影响。
📄 摘要(原文)
While Graph Foundation Models (GFMs) have achieved remarkable success in homogeneous graphs, extending them to multi-domain heterogeneous graphs (MDHGs) remains a formidable challenge due to cross-type feature shifts and intra-domain relation gaps. Existing global feature alignment methods (PCA or SVD) enforce a shared feature space blindly, which distorts type-specific semantics and disrupts original topologies, inevitably leading to "Type Collapse" and "Relation Confusion". To address these fundamental limitations, we propose Decoupled relation Subspace Alignment (DRSA), a novel, plug-and-play relation-driven alignment framework. DRSA fundamentally shifts the paradigm by decoupling feature semantics from relation structures. Specifically, it introduces a dual-relation subspace projection mechanism to coordinate cross-type interactions within a shared low-rank relation subspace explicitly. Furthermore, a feature-structure decoupled representation is designed to decompose aligned features into a semantic projection component and a structural residual term, adaptively absorbing intra-domain variations. Optimized via a stable alternating minimization strategy based on Block Coordinate Descent, DRSA constructs a well-calibrated, structure-aware latent space. Extensive experiments on multiple real-world benchmark datasets demonstrate that DRSA can be seamlessly integrated as a universal preprocessing module, significantly and consistently enhancing the cross-domain and few-shot knowledge transfer capabilities of state-of-the-art GFMs. The code is available at: https://github.com/zhengziyu77/DSRA.