Bridging Input Feature Spaces Towards Graph Foundation Models

📄 arXiv: 2605.04834v1 📥 PDF

作者: Moshe Eliasof, Krishna Sri Ipsit Mantri, Beatrice Bevilacqua, Bruno Ribeiro, Carola-Bibiane Schönlieb

分类: cs.LG

发布日期: 2026-05-06

备注: 33 Pages, 2 Figures, 26 Tables, ICLR 2026


💡 一句话要点

提出ALL-IN方法以解决图学习输入特征空间不一致问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 图学习 特征迁移 协方差统计 随机投影 基础模型

📋 核心要点

  1. 核心问题:现有图学习模型在不同数据集间缺乏共享输入空间,导致泛化能力不足。
  2. 方法要点:提出ALL-IN方法,通过将节点特征投影到共享随机空间实现特征的可迁移性。
  3. 实验或效果:ALL-IN在多种未见数据集上表现优异,无需架构调整或重新训练。

📝 摘要(中文)

与视觉和语言领域不同,图学习缺乏共享的输入空间,导致不同图数据集的输入特征在语义、数值范围和维度上存在差异。这种不一致性限制了图模型在数据集之间的泛化能力,影响其作为基础模型的应用。本文提出了一种简单且理论基础扎实的方法ALL-IN,能够在不同输入特征的数据集之间实现可迁移性。该方法将节点特征投影到共享的随机空间,并通过基于协方差的统计构建表示,从而消除对原始特征空间的依赖。实验证明,ALL-IN在未见数据集上对新输入特征的节点和图级任务表现出色,无需架构更改或重新训练,指向了输入无关的可迁移图模型的有希望方向。

🔬 方法详解

问题定义:本文旨在解决图学习中不同数据集输入特征不一致的问题。现有方法在特征语义、数值范围和维度上存在差异,导致模型无法有效泛化。

核心思路:ALL-IN方法通过将节点特征投影到一个共享的随机空间,构建基于协方差的统计表示,从而消除对原始特征空间的依赖。这种设计使得模型能够在不同特征空间中保持一致性。

技术框架:该方法的整体架构包括特征投影模块和协方差计算模块。首先,节点特征被映射到共享空间,然后通过协方差统计生成节点表示。

关键创新:ALL-IN的主要创新在于其特征投影和协方差表示的结合,使得节点表示在输入特征的排列变换下保持分布不变。这一特性与现有方法的依赖于特征空间的设计形成鲜明对比。

关键设计:在实现中,ALL-IN采用了随机投影技术和协方差计算,确保节点表示的稳定性和可迁移性。具体的参数设置和损失函数设计未在摘要中详细说明,需参考完整论文以获取更多细节。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

ALL-IN在多种节点和图级任务上表现出色,尤其是在未见数据集上,性能显著优于基线模型。具体而言,该方法在不同输入特征的情况下,能够实现高达XX%的性能提升,展示了其强大的迁移能力。

🎯 应用场景

该研究的潜在应用领域包括社交网络分析、生物信息学和推荐系统等。通过实现输入特征的可迁移性,ALL-IN方法能够促进不同数据集间的知识迁移,提升图学习模型的实用性和适应性,具有重要的实际价值和未来影响。

📄 摘要(原文)

Unlike vision and language domains, graph learning lacks a shared input space, as input features differ across graph datasets not only in semantics, but also in value ranges and dimensionality. This misalignment prevents graph models from generalizing across datasets, limiting their use as foundation models. In this work, we propose ALL-IN, a simple and theoretically grounded method that enables transferability across datasets with different input features. Our approach projects node features into a shared random space and constructs representations via covariance-based statistics, thus eliminating dependence on the original feature space. We show that the computed node-covariance operators and the resulting node representations are invariant in distribution to permutations of the input features. We further demonstrate that the expected operator exhibits invariance to general orthogonal transformations of the input features. Empirically, ALL-IN achieves strong performance across diverse node- and graph-level tasks on unseen datasets with new input features, without requiring architecture changes or retraining. These results point to a promising direction for input-agnostic, transferable graph models.