Suiren-1.0 Technical Report: A Family of Molecular Foundation Models
作者: Junyi An, Xinyu Lu, Yun-Fei Shi, Li-Cheng Xu, Nannan Zhang, Chao Qu, Yuan Qi, Fenglei Cao
分类: physics.chem-ph, cs.AI
发布日期: 2026-03-23
备注: 23 pages,5 figures
💡 一句话要点
Suiren-1.0:构建分子领域基础模型,实现量子性质预测与高效下游应用
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 分子建模 基础模型 量子性质预测 分子间相互作用 构象压缩蒸馏 SE(3)-等变网络 扩散模型
📋 核心要点
- 现有分子建模方法难以有效连接3D构象几何与2D统计系综空间,限制了模型在复杂有机系统中的应用。
- Suiren-1.0通过预训练三个专门变体,并结合构象压缩蒸馏框架,实现了3D到2D表示的有效转换。
- 实验表明,Suiren-1.0在量子性质预测等任务中取得了最先进的结果,并开源了模型和基准测试。
📝 摘要(中文)
本文介绍了Suiren-1.0,一系列用于精确建模各种有机系统的分子领域基础模型。Suiren-1.0包含三个专门的变体(Suiren-Base、Suiren-Dimer和Suiren-ConfAvg),集成在一个算法框架中,该框架弥合了3D构象几何空间和2D统计系综空间之间的差距。首先,使用空间自监督和SE(3)-等变架构,在包含7000万个样本的密度泛函理论数据集上预训练Suiren-Base(18亿参数),在量子性质预测中实现了稳健的性能。Suiren-Dimer通过在1350万个分子间相互作用样本上继续预训练来扩展此功能。为了实现高效的下游应用,我们提出了一种基于扩散的构象压缩蒸馏(CCD)框架,该框架将复杂的3D结构表示提炼为2D构象平均表示。这产生了轻量级的Suiren-ConfAvg,它可以从SMILES或分子图中生成高保真表示。我们广泛的评估表明,Suiren-1.0在一系列任务中建立了最先进的结果。所有模型和基准测试都是开源的。
🔬 方法详解
问题定义:现有分子建模方法在处理复杂有机系统时,难以将3D构象几何信息与2D统计系综信息有效结合,导致模型在量子性质预测等任务中表现受限。此外,高精度3D模型计算成本高昂,不利于下游应用的快速部署。
核心思路:Suiren-1.0的核心思路是构建一个包含多个变体的分子基础模型家族,通过预训练学习分子结构的内在表示,并利用构象压缩蒸馏技术将复杂的3D结构信息提炼为轻量级的2D表示,从而实现高效的下游应用。这种设计旨在兼顾模型的精度和效率。
技术框架:Suiren-1.0的技术框架包含三个主要阶段:1) Suiren-Base的预训练,使用空间自监督和SE(3)-等变架构在大规模数据集上学习分子结构的通用表示;2) Suiren-Dimer的继续预训练,专注于分子间相互作用的建模;3) Conformation Compression Distillation (CCD),将Suiren-Base的3D表示蒸馏为Suiren-ConfAvg的2D表示。整体流程是从高精度3D模型到轻量级2D模型的转换,以适应不同的应用场景。
关键创新:该论文的关键创新在于Conformation Compression Distillation (CCD) 框架,它利用扩散模型将复杂的3D结构表示压缩为2D构象平均表示。这种方法能够在保持高保真度的同时,显著降低模型的计算成本,使得模型能够高效地应用于下游任务。与现有方法相比,CCD能够更好地平衡模型的精度和效率。
关键设计:Suiren-Base采用SE(3)-等变架构,保证模型对分子旋转和平移的不变性。预训练使用密度泛函理论数据集,包含7000万个样本。Suiren-Dimer在1350万个分子间相互作用样本上进行继续预训练。CCD框架使用扩散模型进行蒸馏,损失函数旨在最小化3D和2D表示之间的差异。Suiren-ConfAvg可以使用SMILES或分子图作为输入。
🖼️ 关键图片
📊 实验亮点
Suiren-1.0在多个分子建模任务中取得了最先进的结果。Suiren-Base在量子性质预测任务中表现出色,Suiren-Dimer能够准确预测分子间相互作用。通过CCD框架,Suiren-ConfAvg在保持高精度的同时,显著降低了计算成本,实现了高效的下游应用。所有模型和基准测试均已开源。
🎯 应用场景
Suiren-1.0可广泛应用于药物发现、材料设计等领域。通过精确预测分子的量子性质和分子间相互作用,加速新药筛选和新型材料的研发过程。轻量级的Suiren-ConfAvg模型能够高效地应用于高通量筛选和分子性质预测,为相关领域的研究提供强大的工具。
📄 摘要(原文)
We introduce Suiren-1.0, a family of molecular foundation models for the accurate modeling of diverse organic systems. Suiren-1.0 comprising three specialized variants (Suiren-Base, Suiren-Dimer, and Suiren-ConfAvg) is integrated within an algorithmic framework that bridges the gap between 3D conformational geometry and 2D statistical ensemble spaces. We first pre-train Suiren-Base (1.8B parameters) on a 70M-sample Density Functional Theory dataset using spatial self-supervision and SE(3)-equivariant architectures, achieving robust performance in quantum property prediction. Suiren-Dimer extends this capability through continued pre-training on 13.5M intermolecular interaction samples. To enable efficient downstream application, we propose Conformation Compression Distillation (CCD), a diffusion-based framework that distills complex 3D structural representations into 2D conformation-averaged representations. This yields the lightweight Suiren-ConfAvg, which generates high-fidelity representations from SMILES or molecular graphs. Our extensive evaluations demonstrate that Suiren-1.0 establishes state-of-the-art results across a range of tasks. All models and benchmarks are open-sourced.