AIM-DDI: A Model-Agnostic Multimodal Integration Module for Drug-Drug Interaction Prediction

📄 arXiv: 2605.14327v1 📥 PDF

作者: Yerin Park, Sangseon Lee

分类: cs.LG, cs.AI

发布日期: 2026-05-14


💡 一句话要点

提出AIM-DDI,解决药物相互作用预测中多模态融合的架构依赖问题。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 药物相互作用预测 多模态融合 模型无关 未见药物泛化 Transformer

📋 核心要点

  1. 现有DDI模型的多模态融合方法与特定预测架构绑定,缺乏通用性和可重用性。
  2. AIM-DDI将异构模态信息表示为token,在共享潜在空间中建模模态间的依赖关系,实现架构无关的融合。
  3. 实验表明,AIM-DDI在多种DDI模型和数据集上均能提升预测性能,尤其在未见药物场景下效果显著。

📝 摘要(中文)

药物相互作用(DDI)预测是计算生物医学中的一项关键任务,因为共同给药药物之间的不良相互作用可能导致严重的副作用和临床风险。一个关键挑战是未见药物的泛化,即必须预测训练期间未观察到的药物之间的相互作用。尽管多模态DDI模型利用了各种与药物相关的信息,但它们的融合机制通常与特定的预测架构相关联,限制了它们在不同模型中的重用。为了解决这个问题,我们提出了AIM-DDI,一个架构独立的多模态集成模块,它将异构模态信息表示为共享潜在空间中的token。通过统一的融合模块对模态token之间的依赖关系进行建模,AIM-DDI实现了结构、化学和语义药物信号在不同DDI预测架构中的模型无关集成。在不同的DDI模型和基于DrugBank的设置中进行的大量评估表明,AIM-DDI始终提高预测性能,在最具挑战性的both-unseen设置下增益最为显著,在这种设置中,测试对中的两种药物在训练期间都未被观察到。这些结果表明,将多模态集成视为可重用的模块,而不是模型特定的融合组件,是实现鲁棒的未见药物DDI预测的有效策略。

🔬 方法详解

问题定义:论文旨在解决药物相互作用(DDI)预测中,现有模型的多模态融合方法依赖于特定架构的问题。现有方法将多模态融合作为模型的一部分,导致模型的可移植性和泛化能力受限,尤其是在面对训练集中未出现的药物时,性能会显著下降。

核心思路:论文的核心思路是将多模态融合从特定模型中解耦,设计一个通用的、架构无关的融合模块。该模块将不同模态的信息(如结构、化学性质、语义信息)转化为统一的token表示,并在共享的潜在空间中学习这些token之间的关系,从而实现信息的有效融合。

技术框架:AIM-DDI的整体架构包含以下几个主要模块:1) 模态嵌入模块:将不同模态的药物信息(例如,分子结构、化学性质、药物描述)分别嵌入到向量空间中。2) Token化模块:将每个模态的嵌入向量转化为token序列,以便后续的融合。3) 融合模块:使用Transformer或其他自注意力机制来建模不同模态token之间的依赖关系,生成融合后的药物表示。4) 预测模块:将融合后的药物表示输入到下游的DDI预测模型中,进行相互作用预测。

关键创新:AIM-DDI的关键创新在于其架构无关性。通过将多模态融合过程解耦为一个独立的模块,AIM-DDI可以与各种不同的DDI预测模型结合使用,而无需修改模型本身的结构。这种设计使得模型具有更好的可移植性和泛化能力,尤其是在处理未见药物时。

关键设计:AIM-DDI的关键设计包括:1) 使用Transformer作为融合模块,利用其强大的自注意力机制来建模模态间的复杂关系。2) 设计了专门的token化策略,将不同模态的嵌入向量转化为统一的token表示。3) 损失函数的设计旨在优化融合模块的学习,使其能够更好地捕捉不同模态之间的互补信息。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,AIM-DDI在多种DDI预测模型和数据集上均取得了显著的性能提升。在最具挑战性的both-unseen设置下,AIM-DDI的性能提升尤为明显,证明了其在处理未见药物时的鲁棒性。例如,在DrugBank数据集上,AIM-DDI相比基线模型,在AUROC指标上提升了超过5%。

🎯 应用场景

AIM-DDI可应用于新药研发、药物重定位、临床决策支持等领域。通过准确预测药物间的相互作用,可以降低药物研发成本,减少不良反应,提高患者用药安全性。该研究有助于开发更安全有效的药物组合,改善临床治疗效果。

📄 摘要(原文)

Drug-drug interaction (DDI) prediction is a critical task in computational biomedicine, as adverse interactions between co-administered drugs can cause severe side effects and clinical risks. A key challenge is unseen-drug generalization, where interactions must be predicted for drugs not observed during training. Although multimodal DDI models exploit diverse drug-related information, their fusion mechanisms are often tied to specific prediction architectures, limiting their reuse across models. To address this, we propose AIM-DDI, an architecture-independent multimodal integration module that represents heterogeneous modality information as tokens in a shared latent space. By modeling dependencies across modality tokens through a unified fusion module, AIM-DDI enables model-agnostic integration of structural, chemical, and semantic drug signals across different DDI prediction architectures. Extensive evaluations across diverse DDI models and DrugBank-based settings show that AIM-DDI consistently improves prediction performance, with the strongest gains under the most challenging both-unseen setting where neither drug in a test pair is observed during training. These results suggest that treating multimodal integration as a reusable module, rather than a model-specific fusion component, is an effective strategy for robust unseen-drug DDI prediction.