How Creative Are Large Language Models in Generating Molecules?

📄 arXiv: 2604.18031v1 📥 PDF

作者: Wen Tao, Yiwei Wang, Peng Zhou, Bryan Hooi, Wanlong Fang, Tianle Zhang, Xiao Luo, Yuansheng Liu, Alvin Chan

分类: cs.CL, cs.LG, q-bio.BM

发布日期: 2026-04-20


💡 一句话要点

首个系统性研究:评估大语言模型在分子生成中的创造性表现

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 分子生成 大型语言模型 创造力 药物发现 化学信息学

📋 核心要点

  1. 分子生成任务需要在复杂的化学空间中寻找满足多重约束的解,现有方法难以兼顾探索与约束满足。
  2. 论文将分子生成所需能力重新定义为创造力,并从收敛和发散两个维度系统评估LLM的创造性。
  3. 实验表明LLM在分子生成中展现出独特的创造性模式,例如约束增加时,约束满足程度也随之提高。

📝 摘要(中文)

分子生成需要在庞大且结构化的化学空间中搜索,同时满足多种化学和生物学约束。这使其成为一个非二元问题,有效的模型必须在约束条件下识别非显而易见的解决方案,同时保持探索以通过逃避局部最优来提高成功率。从这个角度来看,创造力是分子生成中的一项功能性要求,而非一种美学概念。大型语言模型(LLM)可以直接从自然语言提示生成分子表示,但它们在这种情况下表现出何种类型的创造力以及如何评估它仍不清楚。本文通过对物理化学、ADMET和生物活性任务进行系统的实证评估,研究了LLM在分子生成中的创造性行为。我们将创造力分为收敛创造力和发散创造力两个互补维度,并分析了不同因素如何影响这些行为。结果表明,LLM在分子生成中表现出独特的创造性行为模式,例如,当施加额外的约束时,约束满足程度会增加。总的来说,我们的工作首次将分子生成所需的能力重新定义为创造力,从而系统地理解了基于LLM的分子生成中的创造力,并阐明了LLM在分子发现流程中的适当使用。

🔬 方法详解

问题定义:分子生成任务旨在设计具有特定化学和生物学性质的分子结构。现有方法,如基于强化学习或生成对抗网络的模型,在探索广阔的化学空间时,往往难以同时满足多个约束条件,容易陷入局部最优,缺乏“创造性”地发现非显而易见的解决方案的能力。

核心思路:论文的核心在于将分子生成过程视为一个需要创造性解决的问题,并利用大型语言模型(LLM)的强大生成能力和对自然语言指令的理解能力来指导分子生成。通过将分子表示(如SMILES字符串)视为一种语言,LLM可以直接从自然语言提示中生成分子,从而实现更灵活和可控的分子设计。

技术框架:该研究主要通过实验评估LLM在分子生成中的创造性。具体流程包括:1) 设计不同的自然语言提示,包含对分子性质、ADMET性质和生物活性的约束;2) 使用LLM生成分子表示(SMILES字符串);3) 使用分子性质预测模型评估生成分子的性质和活性;4) 从收敛创造力(生成满足约束的分子)和发散创造力(生成多样化的分子)两个维度分析LLM的表现。

关键创新:该研究的关键创新在于:1) 将创造力引入分子生成领域,并将其定义为一种功能性需求,而非美学概念;2) 系统性地评估了LLM在分子生成中的创造性表现,并提出了收敛创造力和发散创造力两个互补的评估维度;3) 揭示了LLM在分子生成中独特的创造性行为模式,例如约束增加时,约束满足程度也随之提高。

关键设计:论文的关键设计包括:1) 精心设计的自然语言提示,用于引导LLM生成具有特定性质的分子;2) 使用SMILES字符串作为分子表示,使得LLM可以直接生成分子结构;3) 使用多种分子性质预测模型(如QSAR模型)评估生成分子的性质和活性;4) 定义了收敛创造力(例如,生成符合特定药理学特征的分子)和发散创造力(例如,生成具有新颖骨架结构的分子)的量化指标。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

研究表明,LLM在分子生成中表现出独特的创造性行为。例如,当施加额外的约束时,LLM生成的分子满足约束的程度反而会增加,这表明LLM具有一定的推理和规划能力。此外,研究还发现,LLM在生成具有特定生物活性的分子方面表现良好,能够生成具有潜在药物价值的分子结构。

🎯 应用场景

该研究成果可应用于药物发现、材料科学等领域。通过利用LLM的创造性生成能力,可以加速新分子的设计和筛选过程,降低研发成本,并有可能发现具有突破性疗效的新药或性能优异的新材料。未来,结合LLM和实验验证,有望实现更高效的分子设计和优化。

📄 摘要(原文)

Molecule generation requires satisfying multiple chemical and biological constraints while searching a large and structured chemical space. This makes it a non-binary problem, where effective models must identify non-obvious solutions under constraints while maintaining exploration to improve success by escaping local optima. From this perspective, creativity is a functional requirement in molecular generation rather than an aesthetic notion. Large language models (LLMs) can generate molecular representations directly from natural language prompts, but it remains unclear what type of creativity they exhibit in this setting and how it should be evaluated. In this work, we study the creative behavior of LLMs in molecular generation through a systematic empirical evaluation across physicochemical, ADMET, and biological activity tasks. We characterize creativity along two complementary dimensions, convergent creativity and divergent creativity, and analyze how different factors shape these behaviors. Our results indicate that LLMs exhibit distinct patterns of creative behavior in molecule generation, such as an increase in constraint satisfaction when additional constraints are imposed. Overall, our work is the first to reframe the abilities required for molecule generation as creativity, providing a systematic understanding of creativity in LLM-based molecular generation and clarifying the appropriate use of LLMs in molecular discovery pipelines.