AgentDrug: Utilizing Large Language Models in an Agentic Workflow for Zero-Shot Molecular Optimization

作者: Khiem Le, Ting Hua, Nitesh V. Chawla

分类: cs.LG, cs.AI, cs.CV

发布日期: 2024-10-17 (更新: 2025-10-04)

备注: EMNLP'25 Findings

💡 一句话要点

AgentDrug：利用大语言模型和Agent工作流实现零样本分子优化

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 分子优化 大语言模型 Agent工作流 药物发现 零样本学习

📋 核心要点

分子优化是药物发现的关键，但现有方法依赖大量数据或复杂计算，缺乏灵活性和泛化性。
AgentDrug利用大语言模型，通过嵌套的细化循环，结合化学信息学工具和梯度引导，实现高效分子优化。
实验表明，AgentDrug在单属性和多属性优化任务中，显著优于现有方法，尤其是在严格阈值下。

📝 摘要（中文）

分子优化，即修改给定的分子以改善所需的性质，是药物发现中的一项基本任务。虽然大语言模型（LLM）有潜力通过自然语言驱动优化来解决此任务，但直接提示的准确性有限。本文提出了AgentDrug，一种agent工作流，它利用LLM在一个结构化的细化过程中，显著提高准确性。AgentDrug定义了一个嵌套的细化循环：内循环使用来自化学信息学工具包的反馈来验证分子结构，而外循环使用通用反馈和基于梯度的目标来引导LLM，从而使分子朝着性质改进的方向发展。我们在具有单属性和多属性优化的基准上，在宽松和严格的阈值下评估AgentDrug。结果表明，与以前的方法相比，性能有了显著提高。使用Qwen-2.5-3B，AgentDrug在六个单属性任务上的准确率提高了20.7%（宽松）和16.8%（严格），在八个多属性任务上的准确率提高了7.0%和5.3%。使用更大的模型Qwen-2.5-7B，AgentDrug在6个单属性目标上的准确率进一步提高了28.9%（宽松）和29.0%（严格），在8个多属性目标上的准确率提高了14.9%（宽松）和13.2%（严格）。

🔬 方法详解

问题定义：分子优化旨在改进分子特定属性，是药物发现的核心环节。现有方法通常需要大量数据进行训练，或者依赖复杂的计算模拟，泛化能力和效率受限。直接使用LLM进行分子优化，受限于LLM对化学领域的理解不足，优化效果不佳。

核心思路：AgentDrug的核心在于构建一个agentic工作流，利用LLM的自然语言处理能力，结合化学信息学工具的验证能力，以及梯度引导的优化方向，形成一个迭代优化的闭环。通过这种方式，LLM可以逐步学习和改进分子结构，从而实现高效的分子优化。

技术框架：AgentDrug包含一个嵌套的细化循环。外循环负责指导LLM进行分子结构的修改，并根据通用反馈和基于梯度的目标函数，调整优化方向。内循环则利用化学信息学工具包，对生成的分子结构进行验证，确保其化学合理性。整个流程通过迭代的方式，不断优化分子结构，直到满足预设的性能指标。

关键创新：AgentDrug的关键创新在于将LLM、化学信息学工具和梯度优化方法集成到一个agentic工作流中。这种集成方式充分利用了LLM的自然语言处理能力，化学信息学工具的验证能力，以及梯度优化方法的优化能力，从而实现了高效的分子优化。与现有方法相比，AgentDrug无需大量训练数据，具有更强的泛化能力和灵活性。

关键设计：AgentDrug的关键设计包括：1) 使用Qwen系列大语言模型作为核心agent；2) 设计了基于梯度的目标函数，用于引导LLM进行分子优化；3) 利用RDKit等化学信息学工具包，对生成的分子结构进行验证和评估；4) 通过精心设计的提示工程，指导LLM进行分子结构的修改。

🖼️ 关键图片

📊 实验亮点

AgentDrug在单属性和多属性分子优化任务中均取得了显著的性能提升。使用Qwen-2.5-3B模型，在六个单属性任务上的准确率提高了20.7%（宽松）和16.8%（严格），在八个多属性任务上的准确率提高了7.0%和5.3%。使用更大的Qwen-2.5-7B模型，单属性任务的准确率进一步提高了28.9%（宽松）和29.0%（严格），多属性任务的准确率提高了14.9%（宽松）和13.2%（严格）。

🎯 应用场景

AgentDrug在药物发现领域具有广泛的应用前景，可用于先导化合物的优化、新药设计和药物重定位等。该方法能够显著降低药物研发的成本和时间，加速新药上市进程。此外，AgentDrug还可以应用于材料科学领域，用于优化材料的性能。

📄 摘要（原文）

Molecular optimization -- modifying a given molecule to improve desired properties -- is a fundamental task in drug discovery. While LLMs hold the potential to solve this task using natural language to drive the optimization, straightforward prompting achieves limited accuracy. In this work, we propose AgentDrug, an agentic workflow that leverages LLMs in a structured refinement process to achieve significantly higher accuracy. AgentDrug defines a nested refinement loop: the inner loop uses feedback from cheminformatics toolkits to validate molecular structures, while the outer loop guides the LLM with generic feedback and a gradient-based objective to steer the molecule toward property improvement. We evaluate AgentDrug on benchmarks with both single- and multi-property optimization under loose and strict thresholds. Results demonstrate significant performance gains over previous methods. With Qwen-2.5-3B, AgentDrug improves accuracy by 20.7\% (loose) and 16.8\% (strict) on six single-property tasks, and by 7.0\% and 5.3\% on eight multi-property tasks. With larger model Qwen-2.5-7B, AgentDrug further improves accuracy on 6 single-property objectives by 28.9\% (loose) and 29.0\% (strict), and on 8 multi-property objectives by 14.9\% (loose) and 13.2\% (strict).

AgentDrug: Utilizing Large Language Models in an Agentic Workflow for Zero-Shot Molecular Optimization

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理