Bethe Ansatz with a Large Language Model

📄 arXiv: 2603.29932v1 📥 PDF

作者: Balázs Pozsgay, István Vona

分类: cond-mat.stat-mech, cs.AI, hep-th

发布日期: 2026-03-31

备注: 40 pages


💡 一句话要点

利用大型语言模型求解坐标Bethe Ansatz,发现新型可积自旋链模型。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 Bethe Ansatz 可积自旋链 量子多体物理 PT对称性

📋 核心要点

  1. 现有方法在求解复杂可积自旋链模型的Bethe Ansatz解时面临挑战,计算量大且容易出错。
  2. 利用LLM的强大计算和推理能力,半自主地求解未发表的可积自旋链模型的坐标Bethe Ansatz解。
  3. LLM成功求解了三个模型,其中两个是新的。结果通过精确对角化验证,并发现了独特的自由费米子结构。

📝 摘要(中文)

本文探索了大型语言模型(LLM)在数学物理特定计算中的能力:计算选定可积自旋链模型的坐标Bethe Ansatz解。选择了三个解未发表的可积哈密顿量,其中两个是全新的。观察到LLM在半自主地解决了所有情况下的任务,过程中出现了一些错误,这些错误在研究人员发现后得到了纠正。LLM的结果通过精确对角化(由单独的程序执行)进行了检查,推导过程也经过了作者的检查。Bethe Ansatz解本身就很有趣。第二个模型明显打破了左右对称性,但它是PT对称的,因此其解可能对广义流体动力学中的应用有意义。第三个模型由嵌套Bethe Ansatz的特殊形式求解,其中模型是相互作用的,但嵌套级别具有缺乏U(1)-不变性的自由费米子结构。这种结构似乎是独一无二的,并且是由LLM发现的。使用了OpenAI的ChatGPT 5.2 Pro和5.4 Pro。

🔬 方法详解

问题定义:论文旨在解决复杂可积自旋链模型的坐标Bethe Ansatz解的计算问题。传统方法计算量大,容易出错,且对于新型或特殊结构的自旋链模型,求解过程更加困难。

核心思路:利用大型语言模型(LLM)的强大计算和推理能力,将求解过程转化为LLM可以理解和执行的任务。通过提示工程,引导LLM逐步推导和计算Bethe Ansatz解。

技术框架:该方法主要依赖于LLM(ChatGPT 5.2 Pro和5.4 Pro)。研究人员首先将可积自旋链模型的哈密顿量输入LLM,然后通过一系列提示,引导LLM推导Bethe Ansatz方程,求解本征值和本征态。研究人员负责监督LLM的计算过程,纠正错误,并验证最终结果。

关键创新:该研究的关键创新在于将LLM应用于数学物理中的复杂计算问题,并成功求解了新型可积自旋链模型的Bethe Ansatz解。LLM不仅可以进行数值计算,还可以进行符号推导,这为解决复杂物理问题提供了一种新的途径。此外,LLM还发现了一种独特的自由费米子结构。

关键设计:该研究的关键设计在于提示工程。研究人员需要设计合适的提示,引导LLM逐步推导和计算Bethe Ansatz解。提示的设计需要考虑到LLM的理解能力和计算能力,以及问题的复杂性。此外,研究人员还需要对LLM的输出进行验证,以确保结果的准确性。

📊 实验亮点

LLM成功求解了三个未发表的可积自旋链模型的坐标Bethe Ansatz解,其中两个是全新的。LLM发现了一种独特的自由费米子结构,该结构缺乏U(1)-不变性。所有结果都通过精确对角化进行了验证,证明了LLM在解决复杂物理问题方面的潜力。

🎯 应用场景

该研究成果可应用于量子多体物理、凝聚态物理等领域,为研究新型量子材料和量子现象提供理论基础。利用LLM求解物理问题的方法,有望推广到其他科学领域,加速科学发现的进程。PT对称模型的解在广义流体动力学中具有潜在应用价值。

📄 摘要(原文)

We explore the capability of a Large Language Model (LLM) to perform specific computations in mathematical physics: the task is to compute the coordinate Bethe Ansatz solution of selected integrable spin chain models. We select three integrable Hamiltonians for which the solutions were unpublished; two of the Hamiltonians are actually new. We observed that the LLM semi-autonomously solved the task in all cases, with a few mistakes along the way. These were corrected after the human researchers spotted them. The results of the LLM were checked against exact diagonalization (performed by separate programs), and the derivations were also checked by the authors. The Bethe Ansatz solutions are interesting in themselves. Our second model manifestly breaks left-right invariance, but it is PT-symmetric, therefore its solution could be interesting for applications in Generalized Hydrodynamics. And our third model is solved by a special form of the nested Bethe Ansatz, where the model is interacting, but the nesting level has a free fermionic structure lacking $U(1)$-invariance. This structure appears to be unique and it was found by the LLM. We used ChatGPT 5.2 Pro and 5.4 Pro by OpenAI.