From Experimental Limits to Physical Insight: A Retrieval-Augmented Multi-Agent Framework for Interpreting Searches Beyond the Standard Model

作者: Altan Cakir, Ayca Yerlikaya

分类: hep-ex, cs.AI, cs.IR

发布日期: 2026-05-04

备注: 18 pages, 13 figures

💡 一句话要点

提出HEP-CoPilot，一个检索增强的多Agent框架，用于解释超出标准模型的搜索结果。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 高能物理 超出标准模型 检索增强 多Agent系统 实验数据分析

📋 核心要点

现有方法在整合超出标准模型物理学搜索产生的大量异构信息（文本、数据、图表）时，面临耗时且手动的挑战。
HEP-CoPilot通过检索增强的多Agent框架，统一文本信息、结构化实验数据和重建的物理图，实现证据驱动的推理。
实验表明，HEP-CoPilot能够检索相关测量结果，重建排除限制，并进行跨论文的实验约束比较，加速解释流程。

📝 摘要（中文）

现代超出标准模型物理学的搜索产生了迅速扩展的文献，其中包含异构信息，包括文本分析、数值数据集和图形排除限制。对于物理学家来说，整合这些分布式来源仍然是一个耗时且手动的过程。我们提出了HEP-CoPilot，一个检索增强的多Agent AI框架，用于探索和解释高能物理文献。该系统统一了来自出版物的文本信息、来自HEPData的结构化实验数据以及多模态检索和推理架构中重建的物理图。通过将检索增强的语言模型与协调的Agent工作流程相结合，它能够对实验分析进行基于证据的推理，并对对撞机结果进行结构化的解释。我们在最近的CMS超出标准模型物理学搜索中评估了该框架。案例研究表明，HEP-CoPilot可以检索相关测量结果，直接从HEPData记录中重建排除限制，并执行跨论文的实验约束比较。这使得可以在没有手动数据集成的情况下，进行一致的、具有物理意识的跨分析比较。这些结果表明，检索增强的AI系统可以作为粒子物理学的科学副驾驶，促进复杂文献的导航，构建异构证据，并加速新物理搜索的解释流程。

🔬 方法详解

问题定义：目前，高能物理领域的研究人员在分析超出标准模型（BSM）的实验数据时，面临着信息过载的问题。大量的研究论文、实验数据（如HEPData）以及各种图表分散在不同的来源，手动整合这些异构信息既耗时又容易出错。现有的方法缺乏一个统一的平台，能够自动地检索、整合和推理这些信息，从而阻碍了新物理的发现。

核心思路：HEP-CoPilot的核心思路是利用检索增强的语言模型（Retrieval-Augmented Language Models, RALM）和多Agent系统，构建一个能够自动从各种来源检索相关信息、进行结构化推理和生成可解释结果的框架。通过将文本信息、结构化数据和图表信息整合到一个统一的系统中，HEP-CoPilot旨在帮助物理学家更高效地分析实验数据，并加速新物理的发现。

技术框架：HEP-CoPilot的技术框架主要包括以下几个模块：1) 信息检索模块：负责从各种来源（如研究论文、HEPData）检索相关信息。2) 数据整合模块：负责将检索到的异构信息（文本、数据、图表）进行整合和结构化。3) 推理模块：利用检索增强的语言模型和多Agent系统，对整合后的信息进行推理，例如比较不同实验的约束条件。4) 结果展示模块：将推理结果以易于理解的方式展示给用户，例如生成排除限制图。

关键创新：HEP-CoPilot的关键创新在于其将检索增强的语言模型和多Agent系统相结合，实现对高能物理实验数据的自动化分析和推理。与传统的手动分析方法相比，HEP-CoPilot能够更高效地处理大量的异构信息，并生成可解释的结果。此外，该框架还能够自动从HEPData中重建排除限制图，从而避免了手动数据提取和处理的繁琐过程。

关键设计：HEP-CoPilot的关键设计包括：1) 使用预训练的语言模型（如BERT）作为RALM的基础模型。2) 设计多Agent系统，每个Agent负责特定的任务，例如信息检索、数据整合或推理。3) 定义Agent之间的通信协议，确保Agent能够协同工作。4) 使用特定的损失函数来训练RALM，使其能够更好地理解高能物理领域的知识。

🖼️ 关键图片

📊 实验亮点

HEP-CoPilot在CMS实验数据上进行了评估，结果表明它可以有效地检索相关测量结果，并直接从HEPData记录中重建排除限制。通过跨论文比较实验约束，该框架实现了无需手动数据集成的一致性物理分析。这些结果验证了检索增强AI系统作为粒子物理学科学副驾驶的潜力。

🎯 应用场景

HEP-CoPilot可应用于高能物理领域，辅助物理学家进行超出标准模型的新物理搜索。它能加速实验数据的分析和解释，提高科研效率，并可能促进新物理的发现。该框架还可扩展到其他科学领域，例如材料科学和生物学，用于处理和分析复杂的实验数据。

📄 摘要（原文）

Modern searches for physics beyond the Standard Model produce rapidly expanding literature containing heterogeneous information, including textual analyses, numerical datasets, and graphical exclusion limits. Integrating these distributed sources remains a time-consuming and manual process for physicists. We present HEP-CoPilot, a retrieval-augmented multi-agent AI framework for the exploration and interpretation of high-energy physics literature. The system unifies textual information from publications, structured experimental data from HEPData, and reconstructed physics plots within a multimodal retrieval and reasoning architecture. By combining retrieval-augmented language models with coordinated agent workflows, it enables evidence-grounded reasoning over experimental analyses and structured interpretation of collider results. We evaluate the framework on recent CMS searches for physics beyond the Standard Model. Case studies show that HEP-CoPilot can retrieve relevant measurements, reconstruct exclusion limits directly from HEPData records, and perform cross-paper comparisons of experimental constraints. This enables consistent, physics-aware comparison across analyses without manual data integration. These results demonstrate that retrieval-augmented AI systems can function as scientific co-pilots for particle physics, facilitating navigation of complex literature, structuring heterogeneous evidence, and accelerating the interpretation pipeline for new physics searches.

From Experimental Limits to Physical Insight: A Retrieval-Augmented Multi-Agent Framework for Interpreting Searches Beyond the Standard Model

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理