Particle-Lund Multimodality in Jet Taggers

📄 arXiv: 2605.26821v1 📥 PDF

作者: Loukas Gouskos, Benedikt Maier

分类: hep-ph, cs.LG, hep-ex

发布日期: 2026-05-26


💡 一句话要点

提出PLuM以提升粒子喷流标记的性能

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多模态架构 喷流标记 量子色动力学 深度学习 高能物理 变换器模型

📋 核心要点

  1. 现有的基于变换器的喷流标记方法是否能够有效捕捉层次化的QCD结构仍然不确定,存在潜在的性能提升空间。
  2. PLuM通过将粒子成分和Lund平面信息投影到共享潜在空间,利用交叉注意力机制共同处理这两种信息,旨在提升标记性能。
  3. 在高能物理分析中,PLuM在25%的di-Higgs效率工作点上实现了25%的背景拒绝率提升,显示出显著的性能改进。

📝 摘要(中文)

Lund平面提供了一种物理动机的层次化表示,用于描述喷流中的量子色动力学(QCD)辐射。本文研究了基于变换器的标记器是否能够从粒子成分的输入中隐式捕捉层次化的QCD结构,或是否显式的物理表示仍然是互补的。为此,我们提出了PLuM,这是一种多模态架构,将粒子成分和Lund平面分裂投影到共享的潜在空间中,并通过统一的变换器共同处理。交叉注意力机制使模型能够探测结构化的QCD信息是否提供了超越粒子本身编码的区分能力。我们观察到在顶夸克和H→b b̄标记中有系统性的提升,而在H→c c̄或H→4q拓扑中未发现类似的改善。这种选择性增强表明,即使在高度表达的架构中,关于b-jet形成的显式层次信息仍然与原始粒子表示互补。

🔬 方法详解

问题定义:本文旨在解决现有喷流标记器在捕捉层次化QCD结构方面的不足,尤其是基于变换器的模型是否能够充分利用粒子成分的输入。

核心思路:PLuM的核心思想是将粒子成分与Lund平面信息结合,通过共享潜在空间和交叉注意力机制共同处理,以增强模型的区分能力。

技术框架:PLuM的整体架构包括两个主要模块:一是粒子成分的编码,二是Lund平面分裂的编码,二者通过统一的变换器进行处理,交叉注意力机制用于信息的融合。

关键创新:PLuM的最大创新在于其多模态架构,能够同时处理粒子成分和物理结构信息,提供了比传统方法更深层次的理解和性能提升。

关键设计:模型设计中采用了共享潜在空间的概念,交叉注意力机制的实现,以及针对特定任务的损失函数设置,以确保模型在高能物理分析中的有效性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

PLuM在高能物理分析中表现出色,在25%的di-Higgs效率工作点上实现了25%的背景拒绝率提升,相较于基线模型显示出显著的性能改进,尤其在顶夸克和H→b b̄标记中表现突出。

🎯 应用场景

该研究的潜在应用领域包括高能物理实验,特别是在大型强子对撞机(LHC)中的喷流标记和事件分类。PLuM的设计可以帮助研究人员更有效地识别复杂的粒子事件,推动新物理的发现,并为未来的实验提供更强大的数据分析工具。

📄 摘要(原文)

The Lund plane offers a physics-motivated, hierarchical representation of QCD radiation within jets, while transformer-based taggers have reached state-of-the-art performance by learning directly from raw particle constituents and their pairwise relations. We investigate whether transformers implicitly capture hierarchical QCD structure from constituent-level inputs, or whether explicit physics representations remain complementary. To test this, we introduce PLuM, a multimodal architecture that projects particle constituents and Lund plane splittings into a shared latent space, processing both jointly with a unified transformer. Cross-attention allows the model to probe whether structured QCD information provides discriminating power beyond what particles alone encode. We observe systematic gains for top-quark and $\mathrm{H}\to\mathrm{b}\bar{\mathrm{b}}$ tagging, while finding no comparable improvement for $\mathrm{H}\to\mathrm{c}\bar{\mathrm{c}}$ or $\mathrm{H}\to 4\mathrm{q}$ topologies. This selective enhancement suggests that explicit hierarchical information about b-jet formation remains complementary to raw particle representations even in highly expressive architectures, while other topologies are already well-captured at constituent level. For high-impact LHC analyses such as Lorentz-boosted di-Higgs searches in the four $\mathrm{b}$ quark final state ($\mathrm{H}\mathrm{H}(4\mathrm{b})$), the gains are substantial: at a $25\%$ di-Higgs efficiency working point, PLuM achieves $25\%$ higher background rejection than the baseline. Our results indicate that physically structured representations of QCD radiation retain discriminating value in the transformer era, motivating further study into how different aspects of jet dynamics are encoded by deep learning algorithms.