Efficient Identification of Critical Transitions via Flow Matching: A Scalable Generative Approach for Many-Body Systems

📄 arXiv: 2508.15318v4 📥 PDF

作者: Qian-Rui Lee, Daw-Wei Wang

分类: cond-mat.stat-mech, cs.LG

发布日期: 2025-08-21 (更新: 2026-01-04)

备注: 23 pages, 20 figures


💡 一句话要点

提出基于Flow Matching的机器学习框架,高效识别多体系统中的临界跃迁。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: Flow Matching 多体系统 临界跃迁 机器学习 相变 蒙特卡洛模拟 U-Net

📋 核心要点

  1. 传统方法在识别多体系统临界跃迁时,计算成本高昂,尤其是在处理大规模系统时。
  2. 利用Flow Matching学习稳定的概率流矢量场,结合U-Net架构捕获尺度不变的局部相关性,实现高效的临界性质识别。
  3. 实验表明,该方法在二维XY模型上,仅需小规模数据训练,即可推广到更大系统,并加速蒙特卡洛模拟。

📝 摘要(中文)

本文提出了一种基于Flow Matching (FM) 的机器学习框架,用于高效识别多体系统中的临界性质。以二维XY模型为基准,结果表明,仅在小尺寸 ($32 imes 32$) 格子上稀疏温度点训练的单个网络,能够有效地推广到温度和系统尺寸。这种双重泛化能力实现了两个主要应用:(i)快速的“小规模训练,大规模预测”策略,无需重新训练即可定位更大系统 ($128 imes 128$) 的相变点,从而促进有效的有限尺寸标度分析;(ii)快速生成大规模蒙特卡洛模拟的高保真、去相关的初始自旋配置,提供了一个稳健的起点,绕过了传统采样器的长热化时间。这些能力源于Flow Matching框架(学习稳定的概率流矢量场)和U-Net架构的归纳偏置(捕获尺度不变的局部相关性)的结合。该方法为探索热力学极限提供了一种可扩展且高效的工具,既可以作为相边界的快速探索器,又可以作为高精度研究的高性能初始化器。

🔬 方法详解

问题定义:论文旨在解决多体系统中临界跃迁的高效识别问题。传统方法,如蒙特卡洛模拟,在接近临界点时需要极长的热化时间,计算成本很高,尤其是在处理大规模系统时。此外,有限尺寸标度分析需要对不同尺寸的系统进行多次模拟,进一步增加了计算负担。

核心思路:论文的核心思路是利用Flow Matching (FM) 学习系统状态的概率分布,并以此来快速生成符合目标分布的样本。Flow Matching通过学习一个连续的矢量场,将一个简单的先验分布(如高斯分布)转换为目标分布。通过学习这个矢量场,可以快速生成符合目标分布的样本,从而避免了传统蒙特卡洛模拟的缓慢热化过程。

技术框架:该方法主要包含以下几个阶段:1) 数据准备:从不同温度下的二维XY模型中采样得到自旋配置数据。2) 网络训练:使用U-Net架构训练Flow Matching模型,使其学习从高斯分布到目标自旋配置分布的概率流矢量场。3) 相变点预测:利用训练好的模型,对更大尺寸的系统进行相变点预测,无需重新训练。4) 初始配置生成:利用训练好的模型,快速生成大规模蒙特卡洛模拟所需的初始自旋配置。

关键创新:该方法最重要的技术创新点在于将Flow Matching框架应用于多体系统的临界性质识别。与传统的基于马尔可夫链的蒙特卡洛方法相比,Flow Matching可以直接学习目标分布,从而避免了缓慢的热化过程。此外,该方法具有良好的泛化能力,可以在小规模数据上训练,并推广到更大规模的系统。

关键设计:论文使用了U-Net作为Flow Matching模型的网络结构,U-Net的跳跃连接可以有效地捕获不同尺度的特征,从而提高模型的泛化能力。损失函数采用Flow Matching的标准损失函数,旨在最小化预测的矢量场与真实矢量场之间的差异。在训练过程中,使用了Adam优化器,并设置了合适的学习率和batch size。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在二维XY模型上,仅使用小尺寸 ($32 imes 32$) 格子上的数据进行训练,即可准确预测更大尺寸 ($128 imes 128$) 系统的相变点,无需重新训练。此外,该方法生成的初始自旋配置可以显著缩短蒙特卡洛模拟的热化时间,提高模拟效率。与传统方法相比,该方法在相变点预测和初始配置生成方面均表现出显著的优势。

🎯 应用场景

该研究成果可广泛应用于凝聚态物理、材料科学等领域,用于快速探索复杂系统的相图,加速材料设计和发现过程。此外,该方法还可以作为大规模计算模拟的初始化工具,提高模拟效率,降低计算成本。未来,该方法有望推广到其他类型的多体系统,例如蛋白质折叠、金融市场建模等。

📄 摘要(原文)

We propose a machine learning framework based on Flow Matching (FM) to identify critical properties in many-body systems efficiently. Using the 2D XY model as a benchmark, we demonstrate that a single network, trained only on configurations from a small ($32\times 32$) lattice at sparse temperature points, effectively generalizes across both temperature and system size. This dual generalization enables two primary applications for large-scale computational physics: (i) a rapid "train-small, predict-large" strategy to locate phase transition points for significantly larger systems ($128\times 128$) without retraining, facilitating efficient finite-size scaling analysis; and (ii) the fast generation of high-fidelity, decorrelated initial spin configurations for large-scale Monte Carlo simulations, providing a robust starting point that bypasses the long thermalization times of traditional samplers. These capabilities arise from the combination of the Flow Matching framework, which learns stable probability-flow vector fields, and the inductive biases of the U-Net architecture that capture scale-invariant local correlations. Our approach offers a scalable and efficient tool for exploring the thermodynamic limit, serving as both a rapid explorer for phase boundaries and a high-performance initializer for high-precision studies.