Atomic Trajectory Modeling with State Space Models for Biomolecular Dynamics
作者: Liang Shi, Jiarui Lu, Junqi Liu, Chence Shi, Zhi Yang, Jian Tang
分类: q-bio.BM, cs.LG
发布日期: 2026-03-18
💡 一句话要点
提出ATMOS,基于状态空间模型生成生物分子动力学的原子级轨迹,加速药物发现。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 生物分子动力学 状态空间模型 深度生成模型 Pairformer 扩散模型 原子轨迹 蛋白质-配体相互作用
📋 核心要点
- 分子动力学模拟计算成本高昂,限制了其在长时间尺度上的应用,而现有深度生成模型难以捕捉生物分子动态过程中的时间依赖性。
- ATMOS基于状态空间模型,利用Pairformer捕获长程时间依赖性,并结合扩散模型自回归地解码轨迹帧,从而生成原子级MD轨迹。
- ATMOS在蛋白质单体和蛋白质-配体复合物的构象轨迹生成方面取得了最先进的性能,为生物分子动力学建模提供了新的方法。
📝 摘要(中文)
理解生物分子的动态行为对于阐明生物学功能和促进药物发现至关重要。分子动力学(MD)模拟为研究这些动态提供了严格的物理基础,但对于长时间尺度来说,计算成本仍然很高。另一方面,最近的深度生成模型加速了构象生成,但通常无法对时间关系进行建模,或者仅为单体蛋白质构建。为了弥合这一差距,我们引入了ATMOS,这是一个基于状态空间模型(SSM)的新型生成框架,旨在为生物分子系统生成原子级MD轨迹。ATMOS集成了一个基于Pairformer的状态转移机制来捕获长程时间依赖性,以及一个基于扩散的模块,以自回归方式解码轨迹帧。ATMOS在来自PDB的晶体结构和来自包括mdCATH和MISATO的大规模MD模拟数据集的构象轨迹上进行训练。我们证明ATMOS在为蛋白质单体和复杂的蛋白质-配体系统生成构象轨迹方面实现了最先进的性能。通过实现原子运动轨迹的有效推断,这项工作为生物分子动力学建模奠定了有希望的基础。
🔬 方法详解
问题定义:论文旨在解决生物分子动力学模拟中,传统分子动力学方法计算成本高昂,以及现有深度生成模型无法有效建模时间依赖性的问题。现有方法在处理长时间尺度的生物分子动态过程时面临挑战,限制了其在药物发现等领域的应用。
核心思路:论文的核心思路是利用状态空间模型(SSM)来建模生物分子的动态过程。SSM能够有效地捕捉时间序列数据中的依赖关系,并进行预测。通过将生物分子的构象轨迹视为一个状态序列,ATMOS能够学习到状态之间的转移规律,从而生成逼真的分子动力学轨迹。
技术框架:ATMOS框架主要包含两个模块:基于Pairformer的状态转移模块和基于扩散模型的解码模块。状态转移模块负责根据当前状态预测下一个状态,Pairformer用于捕捉长程时间依赖性。解码模块则将状态解码为原子坐标,采用扩散模型以保证生成轨迹的真实性和多样性。整个过程是自回归的,即每个时刻的状态都依赖于之前的状态。
关键创新:ATMOS的关键创新在于将状态空间模型与深度学习技术相结合,用于生成原子级别的生物分子动力学轨迹。具体来说,Pairformer的引入使得模型能够捕捉长程时间依赖性,而扩散模型的使用则保证了生成轨迹的质量。此外,ATMOS能够同时处理蛋白质单体和蛋白质-配体复合物,具有更广泛的适用性。
关键设计:Pairformer作为状态转移模块的核心,其具体结构和参数设置对模型性能至关重要。扩散模型采用自回归的方式进行解码,需要仔细设计噪声 schedule 和采样策略。损失函数的设计也需要考虑生成轨迹的真实性和多样性,可能包括重构损失、对抗损失等。具体的训练策略,如学习率、batch size等,也会影响模型的最终性能。
🖼️ 关键图片
📊 实验亮点
ATMOS在生成蛋白质单体和蛋白质-配体复合物的构象轨迹方面取得了最先进的性能。实验结果表明,ATMOS生成的轨迹在真实性和多样性方面均优于现有方法。具体性能数据(如与现有方法的比较结果)在论文中进行了详细展示,证明了ATMOS的有效性。
🎯 应用场景
ATMOS在药物发现领域具有广阔的应用前景。它可以用于预测蛋白质的构象变化,研究蛋白质与配体的相互作用,从而加速药物筛选和设计过程。此外,ATMOS还可以用于研究生物分子的动态行为,帮助人们更深入地理解生物学过程,例如蛋白质折叠、酶催化等。未来,ATMOS有望成为生物分子模拟的重要工具。
📄 摘要(原文)
Understanding the dynamic behavior of biomolecules is fundamental to elucidating biological function and facilitating drug discovery. While Molecular Dynamics (MD) simulations provide a rigorous physical basis for studying these dynamics, they remain computationally expensive for long timescales. Conversely, recent deep generative models accelerate conformation generation but are typically either failing to model temporal relationship or built only for monomeric proteins. To bridge this gap, we introduce ATMOS, a novel generative framework based on State Space Models (SSM) designed to generate atom-level MD trajectories for biomolecular systems. ATMOS integrates a Pairformer-based state transition mechanism to capture long-range temporal dependencies, with a diffusion-based module to decode trajectory frames in an autoregressive manner. ATMOS is trained across crystal structures from PDB and conformation trajectory from large-scale MD simulation datasets including mdCATH and MISATO. We demonstrate that ATMOS achieves state-of-the-art performance in generating conformation trajectories for both protein monomers and complex protein-ligand systems. By enabling efficient inference of atomic trajectory of motions, this work establishes a promising foundation for modeling biomolecular dynamics.