OOD-GraphLLM: Graph Large Language Model for Out-of-Distribution Generalized Drug Synergy Prediction

📄 arXiv: 2605.30247v1 📥 PDF

作者: Xin Wang, Linxin Xiao, Yang Yao, Wenwu Zhu

分类: cs.LG, cs.MM

发布日期: 2026-05-28

备注: 12 pages, 9 figures, ACM KDD 2026

🔗 代码/项目: GITHUB


💡 一句话要点

提出OOD-GraphLLM,解决药物协同预测中的分布外泛化问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 药物协同预测 图神经网络 大语言模型 分布外泛化 生物医学 分子图表示 语义表示

📋 核心要点

  1. 现有药物协同预测方法难以处理因新型化合物涌现导致的分布外(O.O.D.)偏移问题。
  2. OOD-GraphLLM通过图大语言模型,联合优化分子图表示和生物医学语义语言表示,实现O.O.D.泛化。
  3. 通过微调DrugSyn-LLM和检索增强的指令调优,OOD-GraphLLM能够有效提升O.O.D.药物协同预测的准确性。

📝 摘要(中文)

药物协同预测(DSP)旨在识别不同细胞环境下具有不同靶点的有效药物组合。然而,新型化合物的不断涌现导致分子支架和大小的变化,使得药物协同数据在拓扑结构方面表现出分布外(O.O.D.)偏移。现有方法依赖于同分布(I.D.)假设,无法处理O.O.D.偏移。为了解决这个问题,我们首次研究了通过图大语言模型进行分布外泛化的药物协同预测。然而,O.O.D.泛化的DSP极具挑战性,面临以下难题:i)如何发现与细胞靶点相关的结构相关和不相关的分子表示;ii)如何找到能够准确计算分子表示的最优图神经网络架构;iii)如何在LLM中联合利用分子结构和语义信息。为了应对这些挑战,我们提出了OOD-GraphLLM,一种新型的graphLLM框架,它能够通过统一优化分子图表示和生物医学语义语言表示,准确预测O.O.D.设置下的药物协同作用。此外,我们对生物医学LLM DrugSyn-LLM进行了微调,并采用检索增强的生物医学指令调优策略,将分子拓扑信息和分子语义信息与基于语言的推理对齐,以实现O.O.D.泛化的DSP。源代码和发布模型均已公开。

🔬 方法详解

问题定义:论文旨在解决药物协同预测任务中,由于新化合物的出现导致的分子结构分布外(OOD)泛化问题。现有方法通常假设训练数据和测试数据服从相同的分布,即同分布(ID)假设,这在实际应用中难以满足。因此,现有方法在面对具有新的分子骨架和大小的药物组合时,性能显著下降。

核心思路:论文的核心思路是利用图大语言模型(GraphLLM),将分子图的结构信息和生物医学语义信息进行融合,从而提高模型在OOD场景下的泛化能力。通过联合优化分子图表示和生物医学语义语言表示,模型能够更好地理解药物之间的相互作用,并预测其协同效应。

技术框架:OOD-GraphLLM框架主要包含以下几个模块:1) 分子图表示学习模块,用于提取分子的结构信息;2) 生物医学语义表示学习模块,利用预训练的生物医学语言模型(DrugSyn-LLM)提取药物的语义信息;3) 检索增强的指令调优模块,用于将分子拓扑信息和分子语义信息与基于语言的推理对齐;4) 药物协同预测模块,基于融合的分子图表示和语义表示,预测药物的协同效应。

关键创新:该论文的关键创新在于首次将图大语言模型应用于OOD药物协同预测问题,并提出了一种联合优化分子图表示和生物医学语义语言表示的方法。此外,论文还提出了检索增强的指令调优策略,用于将分子拓扑信息和分子语义信息与基于语言的推理对齐,从而提高模型的泛化能力。

关键设计:论文对DrugSyn-LLM进行了微调,使其更适应药物协同预测任务。同时,采用了检索增强的指令调优策略,具体实现细节未知。损失函数的设计也未知,但推测会包含分子图表示学习、语义表示学习和协同预测三个方面的损失。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文提出了OOD-GraphLLM模型,并在OOD药物协同预测任务上取得了显著的性能提升。具体的性能数据和对比基线未知,但论文强调该模型能够有效处理分布外泛化问题,表明其在实际应用中具有更强的鲁棒性和可靠性。

🎯 应用场景

该研究成果可应用于新药研发领域,加速发现具有协同效应的药物组合,降低研发成本,提高研发效率。此外,该方法还可用于个性化医疗,根据患者的基因组信息和疾病特征,预测最有效的药物组合,实现精准治疗。该研究具有重要的实际应用价值和广阔的未来发展前景。

📄 摘要(原文)

Drug synergy prediction (DSP) aims to identify efficacious drug combinations under various cellular contexts with different targets. However, the continual emergence of novel compounds results in variations in molecular scaffolds and sizes, causing drug synergy data to exhibit out-of-distribution (O.O.D.) shifts with respect to topological structure. Existing works rely on in-distribution (I.D.) assumption, failing to handle the O.O.D. shifts. To solve this problem, we study out-of-distribution generalized drug synergy prediction through a graph large language model for the first time. Nevertheless, O.O.D. generalized DSP is highly non-trivial, posing several challenges: i) how to discover structurally relevant and irrelevant molecular representations with respect to cell targets; ii) how to find the optimal graph neural architectures that accurately calculate molecular representations; and iii) how to jointly leverage molecular structural and semantic information in LLMs. To address these challenges, we propose OOD-GraphLLM, a novel graphLLM framework which is able to accurately predict drug synergy under O.O.D. settings via jointly optimizing molecular graph representation and biomedical semantic language representations in a unified manner. Furthermore, we finetune DrugSyn-LLM, a biomedical LLM, and employ a retrieval-augmented biomedical instruction tuning strategy to align molecular topological information and molecular semantic information with language-based reasoning for O.O.D. generalized DSP. Both the source code (https://github.com/EkkoXiao/Bio-GraphLLM) and released model (https://mn.cs.tsinghua.edu.cn/bio-graphllm/) are publicly available, where users are allowed to download model resources and interactively use the system through a web interface.