A Universal Dense Football Event Representation Based on TabTransformer

📄 arXiv: 2606.09327v1 📥 PDF

作者: Weiran Yang, Daniel Memmert, Maximilian Klemp-Weins

分类: cs.LG, cs.AI

发布日期: 2026-06-08

备注: 12 pages, 1 figure. Preprint submitted to the 13th Workshop on Machine Learning and Data Mining for Sports Analytics (MLSA 2026)


💡 一句话要点

提出基于TabTransformer的通用足球事件密集表示方法以提升分析精度

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 足球事件分析 深度学习 Transformer 特征嵌入 运动分析

📋 核心要点

  1. 现有方法在处理足球事件数据时,主要使用独热编码或序数嵌入,未能充分利用动作描述的内在语义。
  2. 本文提出了一种基于Transformer的模型,通过学习分类特征的潜在依赖关系,生成密集的足球事件表示。
  3. 实验证明,所提出的嵌入表示在下游任务中,相较于基线方法,具有更好的概率校准性能,提升了预测准确性。

📝 摘要(中文)

足球事件数据为团队运动中球员行为的定量分析提供了丰富的时空信息。这些数据集包含异构特征,结合了连续的位置信息和诸如动作类型、结果及身体部位等分类变量。现有方法主要采用独热编码或序数嵌入表示分类特征,忽视了动作描述的内在语义。本文提出了一种基于Transformer的模型,通过学习分类事件特征之间的潜在依赖关系,生成足球事件的密集表示。通过将分类特征编码为学习的嵌入向量,捕捉运动特定的动作语义,从而支持后续任务如动作价值评估和比赛风格识别。实证评估表明,该嵌入表示在下游预测任务中,相较于任务特定基线,具有更优的概率校准效果。

🔬 方法详解

问题定义:本文旨在解决现有足球事件数据处理方法在编码分类特征时的不足,特别是未能捕捉动作描述的语义信息。现有方法主要依赖于独热编码或序数嵌入,导致信息损失和表示能力不足。

核心思路:论文提出了一种基于Transformer的模型,通过自注意力机制学习分类特征之间的潜在依赖关系,从而生成密集的事件表示。这种设计能够更好地捕捉运动特定的语义信息,提升下游任务的表现。

技术框架:整体架构包括数据预处理、特征嵌入、Transformer编码器和下游任务模块。数据预处理阶段将原始事件数据转换为适合模型输入的格式,特征嵌入阶段将分类特征编码为向量,Transformer编码器则负责学习特征之间的关系,最后的下游任务模块用于执行具体的预测任务。

关键创新:最重要的技术创新在于将分类特征编码为学习的嵌入向量,利用Transformer架构捕捉特征之间的复杂依赖关系。这一方法与传统的独热编码或序数嵌入方法在本质上有所不同,能够更有效地反映动作的语义信息。

关键设计:在模型设计中,采用了适合足球事件数据的损失函数和优化算法,确保模型在训练过程中能够有效学习。此外,Transformer的层数和每层的头数等超参数经过调优,以达到最佳性能。具体的网络结构设计包括多层自注意力机制和前馈神经网络,以增强模型的表达能力。

🖼️ 关键图片

fig_0

📊 实验亮点

实验结果显示,所提出的嵌入表示在下游任务中,相较于任务特定基线,Brier分数显著降低,表明概率校准效果更佳。这一提升证明了模型在动作价值评估和比赛风格识别等任务中的有效性。

🎯 应用场景

该研究的潜在应用领域包括体育分析、运动员评估和战术模式识别等。通过提供更准确的事件表示,能够帮助教练和分析师更好地理解比赛动态,优化战术决策。此外,未来可扩展至其他团队运动的数据分析,具有广泛的实际价值。

📄 摘要(原文)

Football event data constitute a rich spatiotemporal source for quantitative analysis of player actions in team sports. These datasets contain heterogeneous features, combining continuous location coordinates with categorical variables such as action type, action outcome, and body part. Such data have been applied in sports analytics for match outcome forecasting, player evaluation, and tactical pattern recognition. However, existing approaches predominantly encode categorical features using one-hot or ordinal embedding representations, overlooking the intrinsic semantics of action descriptors. The Transformer is a deep neural network architecture based on self-attention that captures dependencies between input features at arbitrary positions. We propose and implement a Transformer-based model to learn latent dependencies among categorical event features and produce dense representations of football events. By encoding categorical features as learned embedding vectors, sport-specific action semantics are captured during pretraining, enabling the representations to support downstream tasks such as action value estimation and play style recognition. Empirical evaluation shows that the embedding representations yield superior probability calibration over task-specific baselines on the downstream prediction tasks, as measured by Brier score.