MixRx: Predicting Drug Combination Interactions with LLMs
作者: Risha Surana, Cameron Saidock, Hugo Chacon
分类: q-bio.OT, cs.AI, cs.CL, cs.LG
发布日期: 2025-12-28
💡 一句话要点
MixRx:利用大型语言模型预测药物组合相互作用
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 药物组合相互作用 大型语言模型 生物医学预测 文本分类 微调
📋 核心要点
- 现有药物相互作用预测方法复杂且耗时,缺乏快速有效的预测工具。
- 利用大型语言模型理解和预测药物组合的相互作用类型(相加、协同、拮抗)。
- 实验表明,微调后的 Mistral Instruct 2.0 模型在预测药物相互作用方面表现出良好的准确率(81.5%)。
📝 摘要(中文)
MixRx 使用大型语言模型 (LLM) 根据多药物患者历史将药物组合相互作用分类为相加、协同或拮抗。我们评估了 GPT-2、Mistral Instruct 2.0 及其微调版本的性能。结果表明,这种应用具有潜力,其中 Mistral Instruct 2.0 微调模型在标准和扰动数据集上的平均准确率得分为 81.5%。本文旨在进一步发展一个新兴的研究领域,即评估 LLM 是否可用于生物预测任务。
🔬 方法详解
问题定义:该论文旨在解决药物组合相互作用预测问题。现有方法通常依赖于复杂的生物实验或计算模拟,耗时且成本高昂。缺乏一种快速、经济且准确的方法来预测药物组合的相互作用类型,这限制了新药研发和个性化医疗的发展。
核心思路:论文的核心思路是将药物组合相互作用预测问题转化为一个文本分类问题,利用大型语言模型(LLM)的强大语言理解和推理能力,从药物组合的描述和患者历史中学习药物之间的相互作用模式。通过微调LLM,使其能够根据输入文本预测药物组合的相互作用类型。
技术框架:该研究的技术框架主要包括以下几个步骤:1)构建包含药物组合、患者历史和相互作用类型的数据集;2)选择预训练的LLM,包括GPT-2和Mistral Instruct 2.0;3)使用数据集对LLM进行微调,使其能够预测药物组合的相互作用类型;4)在标准和扰动数据集上评估微调后的LLM的性能。
关键创新:该研究的关键创新在于将大型语言模型应用于药物组合相互作用预测这一生物医学问题。与传统的生物实验或计算模拟方法相比,该方法具有快速、经济和可扩展的优势。此外,该研究还探索了不同LLM在药物相互作用预测任务中的性能,并发现微调后的Mistral Instruct 2.0模型表现最佳。
关键设计:该研究的关键设计包括:1)选择合适的LLM架构,如GPT-2和Mistral Instruct 2.0;2)设计有效的微调策略,包括选择合适的损失函数和优化器;3)构建高质量的药物组合相互作用数据集,包括药物名称、患者历史和相互作用类型;4)使用标准和扰动数据集评估模型的鲁棒性。
📊 实验亮点
实验结果表明,微调后的 Mistral Instruct 2.0 模型在预测药物组合相互作用方面表现出最佳性能,在标准和扰动数据集上的平均准确率达到 81.5%。这表明大型语言模型在生物医学预测任务中具有巨大的潜力,并为未来的研究提供了新的方向。
🎯 应用场景
该研究成果可应用于新药研发、个性化医疗和药物安全监测等领域。通过快速预测药物组合的相互作用,可以加速新药的筛选和开发过程。在个性化医疗中,可以根据患者的基因组信息和病史,预测药物组合的疗效和安全性,从而制定更有效的治疗方案。此外,该技术还可以用于药物安全监测,及时发现潜在的药物不良反应。
📄 摘要(原文)
MixRx uses Large Language Models (LLMs) to classify drug combination interactions as Additive, Synergistic, or Antagonistic, given a multi-drug patient history. We evaluate the performance of 4 models, GPT-2, Mistral Instruct 2.0, and the fine-tuned counterparts. Our results showed a potential for such an application, with the Mistral Instruct 2.0 Fine-Tuned model providing an average accuracy score on standard and perturbed datasets of 81.5%. This paper aims to further develop an upcoming area of research that evaluates if LLMs can be used for biological prediction tasks.