Efficient Identification of Critical Transitions via Flow Matching: A Scalable Generative Approach for Many-Body Systems

作者: Qian-Rui Lee, Daw-Wei Wang

分类: cond-mat.stat-mech, cs.LG

发布日期: 2025-08-21 (更新: 2026-01-04)

备注: 23 pages, 20 figures

💡 一句话要点

提出基于Flow Matching的机器学习框架，高效识别多体系统中的临界跃迁。

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture)

关键词: Flow Matching 多体系统 临界跃迁 机器学习 相变 蒙特卡洛模拟 U-Net

📋 核心要点

传统方法在识别多体系统临界跃迁时，计算成本高昂，尤其是在处理大规模系统时。
利用Flow Matching学习稳定的概率流矢量场，结合U-Net架构捕获尺度不变的局部相关性，实现高效的临界性质识别。
实验表明，该方法在二维XY模型上，仅需小规模数据训练，即可推广到更大系统，并加速蒙特卡洛模拟。

📝 摘要（中文）

本文提出了一种基于Flow Matching (FM) 的机器学习框架，用于高效识别多体系统中的临界性质。以二维XY模型为基准，结果表明，仅在小尺寸 ($32 imes 32$) 格子上稀疏温度点训练的单个网络，能够有效地推广到温度和系统尺寸。这种双重泛化能力实现了两个主要应用：（i）快速的“小规模训练，大规模预测”策略，无需重新训练即可定位更大系统 ($128 imes 128$) 的相变点，从而促进有效的有限尺寸标度分析；（ii）快速生成大规模蒙特卡洛模拟的高保真、去相关的初始自旋配置，提供了一个稳健的起点，绕过了传统采样器的长热化时间。这些能力源于Flow Matching框架（学习稳定的概率流矢量场）和U-Net架构的归纳偏置（捕获尺度不变的局部相关性）的结合。该方法为探索热力学极限提供了一种可扩展且高效的工具，既可以作为相边界的快速探索器，又可以作为高精度研究的高性能初始化器。

🔬 方法详解

问题定义：论文旨在解决多体系统中临界跃迁的高效识别问题。传统方法，如蒙特卡洛模拟，在接近临界点时需要极长的热化时间，计算成本很高，尤其是在处理大规模系统时。此外，有限尺寸标度分析需要对不同尺寸的系统进行多次模拟，进一步增加了计算负担。

核心思路：论文的核心思路是利用Flow Matching (FM) 学习系统状态的概率分布，并以此来快速生成符合目标分布的样本。Flow Matching通过学习一个连续的矢量场，将一个简单的先验分布（如高斯分布）转换为目标分布。通过学习这个矢量场，可以快速生成符合目标分布的样本，从而避免了传统蒙特卡洛模拟的缓慢热化过程。

技术框架：该方法主要包含以下几个阶段：1) 数据准备：从不同温度下的二维XY模型中采样得到自旋配置数据。2) 网络训练：使用U-Net架构训练Flow Matching模型，使其学习从高斯分布到目标自旋配置分布的概率流矢量场。3) 相变点预测：利用训练好的模型，对更大尺寸的系统进行相变点预测，无需重新训练。4) 初始配置生成：利用训练好的模型，快速生成大规模蒙特卡洛模拟所需的初始自旋配置。

关键创新：该方法最重要的技术创新点在于将Flow Matching框架应用于多体系统的临界性质识别。与传统的基于马尔可夫链的蒙特卡洛方法相比，Flow Matching可以直接学习目标分布，从而避免了缓慢的热化过程。此外，该方法具有良好的泛化能力，可以在小规模数据上训练，并推广到更大规模的系统。

关键设计：论文使用了U-Net作为Flow Matching模型的网络结构，U-Net的跳跃连接可以有效地捕获不同尺度的特征，从而提高模型的泛化能力。损失函数采用Flow Matching的标准损失函数，旨在最小化预测的矢量场与真实矢量场之间的差异。在训练过程中，使用了Adam优化器，并设置了合适的学习率和batch size。

🖼️ 关键图片

📊 实验亮点

实验结果表明，该方法在二维XY模型上，仅使用小尺寸 ($32 imes 32$) 格子上的数据进行训练，即可准确预测更大尺寸 ($128 imes 128$) 系统的相变点，无需重新训练。此外，该方法生成的初始自旋配置可以显著缩短蒙特卡洛模拟的热化时间，提高模拟效率。与传统方法相比，该方法在相变点预测和初始配置生成方面均表现出显著的优势。

🎯 应用场景

该研究成果可广泛应用于凝聚态物理、材料科学等领域，用于快速探索复杂系统的相图，加速材料设计和发现过程。此外，该方法还可以作为大规模计算模拟的初始化工具，提高模拟效率，降低计算成本。未来，该方法有望推广到其他类型的多体系统，例如蛋白质折叠、金融市场建模等。

📄 摘要（原文）

We propose a machine learning framework based on Flow Matching (FM) to identify critical properties in many-body systems efficiently. Using the 2D XY model as a benchmark, we demonstrate that a single network, trained only on configurations from a small ($32\times 32$) lattice at sparse temperature points, effectively generalizes across both temperature and system size. This dual generalization enables two primary applications for large-scale computational physics: (i) a rapid "train-small, predict-large" strategy to locate phase transition points for significantly larger systems ($128\times 128$) without retraining, facilitating efficient finite-size scaling analysis; and (ii) the fast generation of high-fidelity, decorrelated initial spin configurations for large-scale Monte Carlo simulations, providing a robust starting point that bypasses the long thermalization times of traditional samplers. These capabilities arise from the combination of the Flow Matching framework, which learns stable probability-flow vector fields, and the inductive biases of the U-Net architecture that capture scale-invariant local correlations. Our approach offers a scalable and efficient tool for exploring the thermodynamic limit, serving as both a rapid explorer for phase boundaries and a high-performance initializer for high-precision studies.

Efficient Identification of Critical Transitions via Flow Matching: A Scalable Generative Approach for Many-Body Systems

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理