Scientific Hypothesis Generation by a Large Language Model: Laboratory Validation in Breast Cancer Treatment

作者: Abbi Abdel-Rehim, Hector Zenil, Oghenejokpeme Orhobor, Marie Fisher, Ross J. Collins, Elizabeth Bourne, Gareth W. Fearnley, Emma Tate, Holly X. Smith, Larisa N. Soldatova, Ross D. King

分类: q-bio.QM, cs.LG, q-bio.CB

发布日期: 2024-05-20 (更新: 2025-05-08)

备注: 12 pages, 6 tables, 1 figure. Supplementary information available

💡 一句话要点

利用大型语言模型GPT4生成乳腺癌治疗新假设并经实验验证

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 药物组合 乳腺癌治疗 科学假设生成 GPT4

📋 核心要点

现有方法在药物研发中耗时耗力，缺乏高效的假设生成手段。
利用GPT4的“幻觉”特性，生成FDA批准的非癌药物组合，作为潜在的协同治疗乳腺癌的假设。
实验验证表明，GPT4生成的药物组合中，部分具有显著的协同效应，验证了LLM生成科学假设的潜力。

📝 摘要（中文）

大型语言模型（LLM）已经改变了人工智能，并在广泛的任务中取得了突破性进展。在科学领域，LLM最有趣的应用是用于假设生成。LLM的一个特点是，由于其概率结构，输出文本不一定是来自训练文本的有效推论，这被称为幻觉，在许多应用中是有害的。在科学中，一些幻觉可能是新的假设，其有效性可以通过实验室实验来检验。本文在乳腺癌治疗领域，实验性地测试了LLM作为科学假设来源的应用。具体而言，使用GPT4来假设针对MCF7乳腺癌细胞系相对于非肿瘤乳腺细胞系MCF10A的FDA批准的非癌药物的新型协同组合。在第一轮实验室实验中，GPT4成功地发现了十二个测试药物组合中的三个，其协同评分高于阳性对照。GPT4随后根据其初始结果生成了新的组合，这产生了四个测试组合中的另外三个具有阳性协同评分。结论是，LLM是科学假设的有价值的来源。

🔬 方法详解

问题定义：现有药物研发过程依赖于大量的实验和专家知识，耗时且成本高昂。缺乏一种能够快速生成潜在有效药物组合假设的方法。现有方法难以有效利用已有的药物数据和知识，并且容易陷入局部最优解。

核心思路：利用大型语言模型（LLM）的生成能力，特别是其“幻觉”特性，生成新的、非显而易见的药物组合假设。这种方法的核心在于将LLM视为一个创造性的假设生成器，而非仅仅是一个知识检索工具。通过实验验证这些假设，可以加速药物研发过程。

技术框架：该研究使用GPT4作为假设生成器。首先，向GPT4提供关于乳腺癌细胞系（MCF7）和非肿瘤乳腺细胞系（MCF10A）的信息，以及FDA批准的非癌药物列表。然后，要求GPT4生成针对MCF7细胞系具有协同效应，同时对MCF10A细胞系影响较小的药物组合。生成的药物组合随后在实验室进行实验验证。根据实验结果，GPT4进一步优化其假设生成策略，生成新的药物组合。

关键创新：该研究的关键创新在于将LLM应用于科学假设生成，并利用其“幻觉”特性来探索新的药物组合。与传统的基于规则或模型的药物组合预测方法不同，该方法能够生成更具创新性和多样性的假设。通过实验验证，证明了LLM在科学发现中的潜力。

关键设计：研究中，GPT4的prompt设计至关重要，需要清晰地定义目标细胞系、药物类型和期望的协同效应。实验验证采用了标准的细胞培养和药物敏感性测试方法，并使用 SynergyFinder 2.0 工具计算药物组合的协同评分。阳性对照组用于评估实验的可靠性，并作为比较基准。

📊 实验亮点

GPT4在第一轮实验中，从12个测试的药物组合中成功发现了3个具有协同效应的组合，其协同评分高于阳性对照。在第二轮实验中，GPT4基于第一轮的结果生成了4个新的组合，其中3个也表现出阳性协同效应。这些结果表明，GPT4能够有效地生成有价值的科学假设。

🎯 应用场景

该研究成果可应用于药物研发领域，加速新药发现和药物重定位过程。通过利用LLM生成潜在的药物组合假设，可以减少实验筛选的范围，降低研发成本。此外，该方法还可以扩展到其他疾病领域，为个性化医疗提供新的思路。

📄 摘要（原文）

Large language models LLMs have transformed AI and achieved breakthrough performance on a wide range of tasks In science the most interesting application of LLMs is for hypothesis formation A feature of LLMs which results from their probabilistic structure is that the output text is not necessarily a valid inference from the training text These are termed hallucinations and are harmful in many applications In science some hallucinations may be useful novel hypotheses whose validity may be tested by laboratory experiments Here we experimentally test the application of LLMs as a source of scientific hypotheses using the domain of breast cancer treatment We applied the LLM GPT4 to hypothesize novel synergistic pairs of FDA-approved noncancer drugs that target the MCF7 breast cancer cell line relative to the nontumorigenic breast cell line MCF10A In the first round of laboratory experiments GPT4 succeeded in discovering three drug combinations out of twelve tested with synergy scores above the positive controls GPT4 then generated new combinations based on its initial results this generated three more combinations with positive synergy scores out of four tested We conclude that LLMs are a valuable source of scientific hypotheses.

Scientific Hypothesis Generation by a Large Language Model: Laboratory Validation in Breast Cancer Treatment

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理