LEGO-MOF: Equivariant Latent Manipulation for Editable, Generative, and Optimizable MOF Design
作者: Chaoran Zhang, Guangyao Li, Dongxu Ji
分类: cs.LG
发布日期: 2026-04-15
备注: 36 pages including Supplementary Information, 10 figures in the main text and 12 figures/tables in the Supplementary Information
💡 一句话要点
提出LEGO-MOF,实现可编辑、可生成、可优化的金属有机框架设计。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 金属有机框架 生成模型 变分自编码器 等变表示 测试时优化
📋 核心要点
- 现有MOF生成模型依赖预定义模块和不可微优化,限制了结构编辑的连续性。
- 提出LinkerVAE,将MOF结构映射到SE(3)-等变潜在空间,实现几何感知操作。
- 引入测试时优化策略,利用替代模型优化潜在图,显著提升碳捕获性能。
📝 摘要(中文)
金属有机框架(MOFs)在碳捕获方面具有巨大潜力,但其庞大的设计空间带来了挑战。现有的深度生成模型主要作为前馈结构生成器,严重依赖预定义的构建块库和不可微的后优化,从根本上切断了连续结构编辑所需的信息流。本文提出了一个以目标为导向的生成框架,专注于连续结构操作。核心是LinkerVAE,它将离散的3D化学图映射到连续的、SE(3)-等变的潜在空间。这种平滑流形解锁了几何感知操作,包括隐式化学风格迁移和零样本同网状扩展。在此基础上,引入了一种测试时优化(TTO)策略,利用精确的替代模型来连续优化现有MOFs的潜在图,以实现所需的属性。该方法系统地提高了碳捕获性能,在严格保持结构有效性的前提下,纯CO2吸收的平均相对提升高达147.5%。结合潜在扩散模型和刚体组装,用于完整MOF构建,该框架为功能材料的自动发现、目标优化和编辑建立了一个可扩展的、完全可微的途径。
🔬 方法详解
问题定义:金属有机框架(MOFs)的设计空间巨大,传统方法难以有效探索。现有的深度生成模型虽然可以生成MOF结构,但严重依赖预定义的构建块,并且需要进行不可微的后优化,这使得对MOF结构进行连续编辑和优化变得困难,阻碍了目标导向的材料设计。
核心思路:本文的核心思路是将离散的3D化学图映射到一个连续的、SE(3)-等变的潜在空间。通过这种方式,可以将MOF的结构表示为潜在空间中的一个点,从而可以利用连续优化方法来调整MOF的结构,以实现所需的性能。SE(3)-等变性保证了在旋转和平移变换下,潜在表示的性质不变,从而保证了结构的物理合理性。
技术框架:该框架主要包含三个模块:LinkerVAE、测试时优化(TTO)和MOF组装。LinkerVAE负责将离散的MOF结构编码到连续的潜在空间中,并从潜在空间解码回MOF结构。TTO模块利用一个替代模型来评估潜在空间中不同点的性能,并使用梯度下降等优化方法来找到具有最佳性能的MOF结构。MOF组装模块负责将优化后的潜在表示转换为实际的MOF结构。
关键创新:该论文的关键创新在于提出了LinkerVAE,它能够将离散的3D化学图映射到连续的、SE(3)-等变的潜在空间。这使得可以使用连续优化方法来设计MOF结构,从而克服了传统方法的局限性。此外,TTO策略允许在测试时对现有MOF进行优化,而无需重新训练模型。
关键设计:LinkerVAE使用图神经网络(GNN)作为编码器和解码器。编码器将MOF的3D化学图作为输入,并输出一个潜在向量。解码器将潜在向量作为输入,并重建MOF的3D化学图。损失函数包括重建损失和KL散度损失,用于保证潜在空间的平滑性和连续性。TTO模块使用高斯过程回归(GPR)作为替代模型,用于评估潜在空间中不同点的性能。优化算法使用Adam优化器。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在碳捕获性能方面取得了显著提升,在纯CO2吸收方面,平均相对提升高达147.5%,同时严格保持了结构的有效性。此外,该方法还展示了隐式化学风格迁移和零样本同网状扩展的能力,进一步验证了其有效性和通用性。
🎯 应用场景
该研究成果可应用于碳捕获、气体分离、催化等领域。通过自动化设计和优化MOF结构,可以加速新型功能材料的发现,并降低实验成本。该框架为材料科学领域提供了一种强大的计算工具,有望推动相关领域的发展。
📄 摘要(原文)
Metal-organic frameworks (MOFs) are highly promising for carbon capture, yet navigating their vast design space remains challenging. Recent deep generative models enable de novo MOF design but primarily act as feed-forward structure generators. By heavily relying on predefined building block libraries and non-differentiable post-optimization, they fundamentally sever the information flow required for continuous structural editing. Here, we propose a target-driven generative framework focused on continuous structural manipulation. At its core is LinkerVAE, which maps discrete 3D chemical graphs into a continuous, SE(3)-equivariant latent space. This smooth manifold unlocks geometry-aware manipulations, including implicit chemical style transfer and zero-shot isoreticular expansion. Building upon this, we introduce a test-time optimization (TTO) strategy, utilizing an accurate surrogate model to continuously optimize the latent graphs of existing MOFs toward desired properties. This approach systematically enhances carbon capture performance, achieving a striking average relative boost of 147.5% in pure CO2 uptake while strictly preserving structural validity. Integrated with a latent diffusion model and rigid-body assembly for full MOF construction, our framework establishes a scalable, fully differentiable pathway for both the automated discovery, targeted optimization and editing of functional materials.