Uni-Mol3: A Multi-Molecular Foundation Model for Advancing Organic Reaction Modeling

📄 arXiv: 2508.00920v2 📥 PDF

作者: Lirong Wu, Junjie Wang, Zhifeng Gao, Xiaohong Ji, Rong Zhu, Xinyu Li, Linfeng Zhang, Guolin Ke, Weinan E

分类: physics.chem-ph, cs.LG

发布日期: 2025-07-30 (更新: 2025-08-12)


💡 一句话要点

Uni-Mol3:用于推进有机反应建模的多分子基础模型

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 有机反应建模 多分子系统 深度学习 分子表征 预训练

📋 核心要点

  1. 现有单分子表征模型难以有效扩展到多分子反应系统,无法充分捕捉反应机理的复杂性。
  2. Uni-Mol3通过多尺度分子分词器和两阶段预训练策略,实现了从单分子到多分子系统的渐进式学习。
  3. Uni-Mol3在10个数据集上的4个下游任务中超越现有方法,验证了其在复杂有机反应建模中的有效性。

📝 摘要(中文)

有机反应是现代化学工业的基础,对于新材料开发和药物发现至关重要。然而,由于分子动力学的复杂性,解读反应机理和建模多分子关系仍然是巨大的挑战。虽然像Uni-Mol2这样先进的模型已经彻底改变了单分子表征学习,但它们在多分子系统(化学反应固有地发生的地方)中的扩展尚未得到充分探索。本文介绍了一种新颖的深度学习框架Uni-Mol3,它采用分层管道进行多分子反应建模。Uni-Mol3的核心是多尺度分子分词器(Mol-Tokenizer),它将分子的3D结构和其他特征编码为离散token,从而创建3D感知的分子语言。该框架创新性地结合了两个预训练阶段:分子预训练以学习分子语法,以及反应预训练以捕获基本反应原理,从而形成从单分子到多分子系统的渐进式学习范式。通过prompt感知的下游微调,Uni-Mol3在各种有机反应任务中表现出卓越的性能,并支持具有强大泛化能力的多任务预测。跨越10个数据集和4个下游任务的实验结果表明,Uni-Mol3优于现有方法,验证了其在建模复杂有机反应方面的有效性。这项工作不仅开创了多分子计算建模的替代范例,而且通过将分子表征与反应机理理解联系起来,为智能有机反应规划了一条道路。

🔬 方法详解

问题定义:论文旨在解决有机反应建模中,现有单分子表征模型无法有效处理多分子反应体系的问题。现有方法难以捕捉反应物、产物以及反应环境之间的复杂相互作用,导致反应预测和机理理解的准确性受限。

核心思路:Uni-Mol3的核心思路是构建一个能够理解分子结构和反应原理的多分子基础模型。通过将分子表示为离散token,并采用两阶段预训练策略,模型能够学习分子语法和反应规则,从而更好地理解和预测有机反应。

技术框架:Uni-Mol3的整体框架包含以下几个主要模块:1) 多尺度分子分词器(Mol-Tokenizer):将分子的3D结构和其他特征编码为离散token。2) 分子预训练:学习分子语法。3) 反应预训练:捕获基本反应原理。4) Prompt感知的下游微调:针对特定任务进行微调。

关键创新:Uni-Mol3的关键创新在于其多尺度分子分词器和两阶段预训练策略。多尺度分子分词器能够捕捉分子不同尺度的信息,而两阶段预训练策略则实现了从单分子到多分子系统的渐进式学习,使得模型能够更好地理解和预测有机反应。与现有方法相比,Uni-Mol3能够更有效地处理多分子反应体系,并取得更好的性能。

关键设计:Mol-Tokenizer的具体实现细节未知,但其核心思想是将分子的3D结构信息转化为离散的token表示。预训练阶段可能采用了Masked Language Modeling (MLM) 等自监督学习方法。下游微调阶段采用了Prompt Engineering,通过设计合适的Prompt来引导模型进行预测。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

Uni-Mol3在10个数据集上的4个下游任务中取得了显著的性能提升,超越了现有的方法。具体性能数据未知,但论文强调了Uni-Mol3在建模复杂有机反应方面的有效性,并验证了其在多分子反应体系中的优越性。Prompt感知的下游微调也进一步提升了模型的性能和泛化能力。

🎯 应用场景

Uni-Mol3在药物发现、新材料开发等领域具有广泛的应用前景。它可以用于预测有机反应的产物和反应速率,辅助化学家设计更高效的合成路线。此外,Uni-Mol3还可以用于理解反应机理,为化学反应的优化提供理论指导。未来,该模型有望加速化学研究的进程,推动相关领域的发展。

📄 摘要(原文)

Organic reaction, the foundation of modern chemical industry, is crucial for new material development and drug discovery. However, deciphering reaction mechanisms and modeling multi-molecular relationships remain formidable challenges due to the complexity of molecular dynamics. While several state-of-the-art models like Uni-Mol2 have revolutionized single-molecular representation learning, their extension to multi-molecular systems, where chemical reactions inherently occur, has been underexplored. This paper introduces Uni-Mol3, a novel deep learning framework that employs a hierarchical pipeline for multi-molecular reaction modeling. At its core, Uni-Mol3 adopts a multi-scale molecular tokenizer (Mol-Tokenizer) that encodes 3D structures of molecules and other features into discrete tokens, creating a 3D-aware molecular language. The framework innovatively combines two pre-training stages: molecular pre-training to learn the molecular grammars and reaction pre-training to capture fundamental reaction principles, forming a progressive learning paradigm from single- to multi-molecular systems. With prompt-aware downstream fine-tuning, Uni-Mol3 demonstrates exceptional performance in diverse organic reaction tasks and supports multi-task prediction with strong generalizability. Experimental results across 10 datasets spanning 4 downstream tasks show that Uni-Mol3 outperforms existing methods, validating its effectiveness in modeling complex organic reactions. This work not only ushers in an alternative paradigm for multi-molecular computational modeling but also charts a course for intelligent organic reaction by bridging molecular representation with reaction mechanism understanding.