From Experimental Limits to Physical Insight: A Retrieval-Augmented Multi-Agent Framework for Interpreting Searches Beyond the Standard Model

📄 arXiv: 2605.02491v1 📥 PDF

作者: Altan Cakir, Ayca Yerlikaya

分类: hep-ex, cs.AI, cs.IR

发布日期: 2026-05-04

备注: 18 pages, 13 figures


💡 一句话要点

提出HEP-CoPilot,一个检索增强的多Agent框架,用于解释超出标准模型的搜索结果。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 高能物理 超出标准模型 检索增强 多Agent系统 实验数据分析

📋 核心要点

  1. 现有方法在整合超出标准模型物理学搜索产生的大量异构信息(文本、数据、图表)时,面临耗时且手动的挑战。
  2. HEP-CoPilot通过检索增强的多Agent框架,统一文本信息、结构化实验数据和重建的物理图,实现证据驱动的推理。
  3. 实验表明,HEP-CoPilot能够检索相关测量结果,重建排除限制,并进行跨论文的实验约束比较,加速解释流程。

📝 摘要(中文)

现代超出标准模型物理学的搜索产生了迅速扩展的文献,其中包含异构信息,包括文本分析、数值数据集和图形排除限制。对于物理学家来说,整合这些分布式来源仍然是一个耗时且手动的过程。我们提出了HEP-CoPilot,一个检索增强的多Agent AI框架,用于探索和解释高能物理文献。该系统统一了来自出版物的文本信息、来自HEPData的结构化实验数据以及多模态检索和推理架构中重建的物理图。通过将检索增强的语言模型与协调的Agent工作流程相结合,它能够对实验分析进行基于证据的推理,并对对撞机结果进行结构化的解释。我们在最近的CMS超出标准模型物理学搜索中评估了该框架。案例研究表明,HEP-CoPilot可以检索相关测量结果,直接从HEPData记录中重建排除限制,并执行跨论文的实验约束比较。这使得可以在没有手动数据集成的情况下,进行一致的、具有物理意识的跨分析比较。这些结果表明,检索增强的AI系统可以作为粒子物理学的科学副驾驶,促进复杂文献的导航,构建异构证据,并加速新物理搜索的解释流程。

🔬 方法详解

问题定义:目前,高能物理领域的研究人员在分析超出标准模型(BSM)的实验数据时,面临着信息过载的问题。大量的研究论文、实验数据(如HEPData)以及各种图表分散在不同的来源,手动整合这些异构信息既耗时又容易出错。现有的方法缺乏一个统一的平台,能够自动地检索、整合和推理这些信息,从而阻碍了新物理的发现。

核心思路:HEP-CoPilot的核心思路是利用检索增强的语言模型(Retrieval-Augmented Language Models, RALM)和多Agent系统,构建一个能够自动从各种来源检索相关信息、进行结构化推理和生成可解释结果的框架。通过将文本信息、结构化数据和图表信息整合到一个统一的系统中,HEP-CoPilot旨在帮助物理学家更高效地分析实验数据,并加速新物理的发现。

技术框架:HEP-CoPilot的技术框架主要包括以下几个模块:1) 信息检索模块:负责从各种来源(如研究论文、HEPData)检索相关信息。2) 数据整合模块:负责将检索到的异构信息(文本、数据、图表)进行整合和结构化。3) 推理模块:利用检索增强的语言模型和多Agent系统,对整合后的信息进行推理,例如比较不同实验的约束条件。4) 结果展示模块:将推理结果以易于理解的方式展示给用户,例如生成排除限制图。

关键创新:HEP-CoPilot的关键创新在于其将检索增强的语言模型和多Agent系统相结合,实现对高能物理实验数据的自动化分析和推理。与传统的手动分析方法相比,HEP-CoPilot能够更高效地处理大量的异构信息,并生成可解释的结果。此外,该框架还能够自动从HEPData中重建排除限制图,从而避免了手动数据提取和处理的繁琐过程。

关键设计:HEP-CoPilot的关键设计包括:1) 使用预训练的语言模型(如BERT)作为RALM的基础模型。2) 设计多Agent系统,每个Agent负责特定的任务,例如信息检索、数据整合或推理。3) 定义Agent之间的通信协议,确保Agent能够协同工作。4) 使用特定的损失函数来训练RALM,使其能够更好地理解高能物理领域的知识。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

HEP-CoPilot在CMS实验数据上进行了评估,结果表明它可以有效地检索相关测量结果,并直接从HEPData记录中重建排除限制。通过跨论文比较实验约束,该框架实现了无需手动数据集成的一致性物理分析。这些结果验证了检索增强AI系统作为粒子物理学科学副驾驶的潜力。

🎯 应用场景

HEP-CoPilot可应用于高能物理领域,辅助物理学家进行超出标准模型的新物理搜索。它能加速实验数据的分析和解释,提高科研效率,并可能促进新物理的发现。该框架还可扩展到其他科学领域,例如材料科学和生物学,用于处理和分析复杂的实验数据。

📄 摘要(原文)

Modern searches for physics beyond the Standard Model produce rapidly expanding literature containing heterogeneous information, including textual analyses, numerical datasets, and graphical exclusion limits. Integrating these distributed sources remains a time-consuming and manual process for physicists. We present HEP-CoPilot, a retrieval-augmented multi-agent AI framework for the exploration and interpretation of high-energy physics literature. The system unifies textual information from publications, structured experimental data from HEPData, and reconstructed physics plots within a multimodal retrieval and reasoning architecture. By combining retrieval-augmented language models with coordinated agent workflows, it enables evidence-grounded reasoning over experimental analyses and structured interpretation of collider results. We evaluate the framework on recent CMS searches for physics beyond the Standard Model. Case studies show that HEP-CoPilot can retrieve relevant measurements, reconstruct exclusion limits directly from HEPData records, and perform cross-paper comparisons of experimental constraints. This enables consistent, physics-aware comparison across analyses without manual data integration. These results demonstrate that retrieval-augmented AI systems can function as scientific co-pilots for particle physics, facilitating navigation of complex literature, structuring heterogeneous evidence, and accelerating the interpretation pipeline for new physics searches.