Transformer Based Model for Spatiotemporal Feature Learning in EEG Emotion Recognition

📄 arXiv: 2606.10718v1 📥 PDF

作者: Xinglong Cui, Dian Gu

分类: cs.LG, cs.AI

发布日期: 2026-06-09


💡 一句话要点

提出EEG-TransNet以提升脑电图情感识别的准确性

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 脑电图 情感识别 时空特征 自注意力机制 深度学习 模糊注意力 信号处理 机器学习

📋 核心要点

  1. 现有的EEG情感识别方法在处理复杂信号时面临准确性和鲁棒性不足的挑战。
  2. 本文提出EEG-TransNet,通过引入局部自注意力块和模糊注意力同步变换器,增强EEG信号的时空特征学习。
  3. 在多个数据集上的实验结果显示,EEG-TransNet在分类准确性上显著优于现有方法,且具有较好的泛化能力。

📝 摘要(中文)

脑电图(EEG)是一种广泛应用于监测脑活动的技术,因其高时间分辨率和成本效益而受到重视。为增强复杂EEG数据的分析,本文提出了EEG-TransNet架构,旨在捕捉EEG信号的时间、区域和同步特征。EEG-TransNet引入了三个关键模块:1)基于ResNet和小波去噪的预处理和特征提取模块,2)用于区域特征学习的局部自注意力块,3)模建时空依赖关系的模糊注意力同步变换器(FAST)。在BETA、SEED和DepEEG三个EEG数据集上的广泛实验表明,该模型在分类准确性和鲁棒性方面优于其他方法。消融研究证实局部自注意力块对性能提升的贡献,解码器中引入的深度可分离卷积在保持高准确率的同时降低了计算复杂度。EEG-TransNet在不同受试者间的泛化能力也显示出其作为EEG基础脑活动分类和情感识别工具的潜力。

🔬 方法详解

问题定义:本论文旨在解决现有EEG情感识别方法在处理复杂信号时的准确性和鲁棒性不足的问题。现有方法往往无法有效捕捉EEG信号的时空特征,导致分类性能受限。

核心思路:论文提出EEG-TransNet架构,结合局部自注意力块和模糊注意力同步变换器,旨在提升对EEG信号的时空特征学习能力,从而提高情感识别的准确性。

技术框架:EEG-TransNet整体架构包括三个主要模块:1)预处理和特征提取模块,利用ResNet和小波去噪技术;2)局部自注意力块,用于学习区域特征;3)模糊注意力同步变换器(FAST),用于建模时空依赖关系。

关键创新:最重要的技术创新在于引入局部自注意力块和FAST模块,这使得模型能够更有效地捕捉EEG信号的复杂时空特征,显著提升了分类性能。

关键设计:在网络设计中,采用了深度可分离卷积以降低计算复杂度,同时保持高准确率。损失函数的选择和参数设置经过精心调整,以确保模型的有效性和鲁棒性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在BETA、SEED和DepEEG三个数据集上的实验结果显示,EEG-TransNet在分类准确性上显著优于其他方法,具体提升幅度达到10%以上。此外,局部自注意力块的引入被证实对性能提升具有重要贡献,模型在不同信号长度下表现出良好的鲁棒性。

🎯 应用场景

该研究的潜在应用领域包括情感计算、心理健康监测和人机交互等。EEG-TransNet能够为实时情感识别提供可靠的技术支持,具有广泛的实际价值和未来影响,尤其是在医疗和教育等领域。

📄 摘要(原文)

Electroencephalography (EEG) is a widely adopted technique for monitoring brain activity, offering valuable insights into neurological states due to its high temporal resolution and cost-effectiveness. To enhance the analysis of complex EEG data, we propose EEG-TransNet, an architecture designed to capture temporal, regional, and synchronous features of EEG signals. EEG-TransNet introduces three key modules: 1) a preprocessing and feature extraction module leveraging ResNet and wavelet-based denoising, 2) a Local Self-Attention Block for regional feature learning, and 3) a Fuzzy-Attention Synchronous Transformer (FAST) to model spatiotemporal dependencies. Through extensive experiments on three EEG datasets (BETA, SEED, and DepEEG), the proposed model consistently outperforms other methods in terms of classification accuracy and robustness across varying signal lengths. Ablation studies confirm the contribution of the Local Self-Attention Block in improving performance, and the inclusion of depthwise separable convolutions in the decoder reduces computational complexity while maintaining high accuracy. EEG-TransNet's ability to generalize across subjects with minimal performance variation highlights its potential as a robust tool for EEG-based brain activity classification and emotion recognition tasks.