Neural Triangular Transport Maps: A New Approach Towards Sampling in Lattice QCD

📄 arXiv: 2510.13112v1 📥 PDF

作者: Andrey Bryutkin, Youssef Marzouk

分类: cs.LG, hep-lat, physics.comp-ph, stat.ML

发布日期: 2025-10-15


💡 一句话要点

提出稀疏三角运输图以解决格点量子色动力学采样问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 格点量子色动力学 采样方法 稀疏三角运输图 单调整流神经网络 计算物理 多模态性 长程相关性

📋 核心要点

  1. 现有的采样方法在处理格点量子色动力学中的多模态性和长程相关性时面临内存和表达能力的挑战。
  2. 本文提出的稀疏三角运输图通过利用格点图的条件独立结构,采用单调整流神经网络来提高采样效率。
  3. 在二维$φ^4$模型的实验中,提出的方法在稀疏性和性能上优于混合蒙特卡洛和现有流方法。

📝 摘要(中文)

格点场论是计算物理的重要测试平台,但由于其玻尔兹曼分布的多模态性和长程相关性,采样仍然具有挑战性。尽管归一化流提供了有前景的替代方案,但在大格点上的应用受到内存需求和模型表达能力的限制。本文提出的稀疏三角运输图利用周期边界条件下格点图的条件独立结构,采用单调整流神经网络(MRNN),并引入了一个全面的框架,平衡了精确稀疏性和近似稀疏性之间的基本权衡。通过对二维$φ^4$模型的分析,探讨了节点标记对稀疏性和性能的影响,并与混合蒙特卡洛(HMC)及现有流方法(RealNVP)进行了比较。

🔬 方法详解

问题定义:本文旨在解决格点量子色动力学中玻尔兹曼分布的采样问题,现有方法在处理多模态性和长程相关性时面临内存和表达能力的限制。

核心思路:提出的稀疏三角运输图通过利用格点图的条件独立结构,采用单调整流神经网络(MRNN),实现高效的采样。

技术框架:整体架构包括稀疏三角运输图的构建,利用局部过去信息进行并行评估,确保在格点大小$N$下的线性时间复杂度。

关键创新:最重要的创新在于引入了稀疏性与计算可行性之间的权衡,提出了精确稀疏性与近似稀疏性的概念,显著提高了模型的表达能力。

关键设计:关键设计包括对每个三角图组件的限制,使其仅依赖于局部过去信息,采用适当的损失函数和网络结构以保持可逆性和表达性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,提出的稀疏三角运输图在二维$φ^4$模型中表现出优于混合蒙特卡洛(HMC)和现有流方法(RealNVP)的采样性能,具体提升幅度未知,显示出更高的稀疏性和计算效率。

🎯 应用场景

该研究的潜在应用领域包括高能物理、统计物理和计算机科学中的复杂系统模拟。通过提高格点量子色动力学的采样效率,能够更好地理解粒子物理现象,推动相关领域的研究进展。

📄 摘要(原文)

Lattice field theories are fundamental testbeds for computational physics; yet, sampling their Boltzmann distributions remains challenging due to multimodality and long-range correlations. While normalizing flows offer a promising alternative, their application to large lattices is often constrained by prohibitive memory requirements and the challenge of maintaining sufficient model expressivity. We propose sparse triangular transport maps that explicitly exploit the conditional independence structure of the lattice graph under periodic boundary conditions using monotone rectified neural networks (MRNN). We introduce a comprehensive framework for triangular transport maps that navigates the fundamental trade-off between \emph{exact sparsity} (respecting marginal conditional independence in the target distribution) and \emph{approximate sparsity} (computational tractability without fill-ins). Restricting each triangular map component to a local past enables site-wise parallel evaluation and linear time complexity in lattice size $N$, while preserving the expressive, invertible structure. Using $φ^4$ in two dimensions as a controlled setting, we analyze how node labelings (orderings) affect the sparsity and performance of triangular maps. We compare against Hybrid Monte Carlo (HMC) and established flow approaches (RealNVP).