Cueless EEG imagined speech for subject identification: dataset and benchmarks

📄 arXiv: 2501.09700v1 📥 PDF

作者: Ali Derakhshesh, Zahra Dehghanian, Reza Ebrahimpour, Hamid R. Rabiee

分类: cs.LG, cs.AI

发布日期: 2025-01-16


💡 一句话要点

提出无提示脑电想象语音范式,用于安全可靠的个体身份识别

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 脑电信号 想象语音 个体识别 无提示范式 脑机接口

📋 核心要点

  1. 现有基于想象语音的脑电个体识别方法依赖视觉或听觉提示,限制了其自然性和应用场景。
  2. 该研究提出一种无提示的脑电想象语音范式,受试者自主选择并想象词语,更贴近自然状态。
  3. 实验结果表明,该方法在个体识别任务中取得了高达97.93%的分类准确率,性能优异。

📝 摘要(中文)

脑电图(EEG)信号已成为一种有前景的生物识别方式。以往研究主要探索了使用具有语义意义的想象语音进行个体识别,但大多依赖额外的视觉或听觉提示。本研究提出了一种基于无提示脑电的想象语音范式,受试者在没有任何外部提示的情况下,想象发音具有语义意义的词语。这种创新方法通过要求受试者从预定义列表中自然地选择和想象词语,解决了现有方法的局限性。数据集包含来自11名受试者在五个会话中的超过4350个试验。我们评估了各种分类方法,包括传统机器学习技术(如支持向量机(SVM)和XGBoost),以及时间序列基础模型和专门为脑电分类设计的深度学习架构(如EEG Conformer和Shallow ConvNet)。采用基于会话的留出验证策略,以确保可靠的评估并防止数据泄漏。结果表明,分类准确率高达97.93%。这些发现突出了无提示脑电范式在实际应用中(如脑机接口(BCI))进行安全可靠的个体识别的潜力。

🔬 方法详解

问题定义:论文旨在解决基于脑电信号的个体身份识别问题。现有方法通常依赖于视觉或听觉提示来引导受试者的想象语音,这在实际应用中存在局限性,因为这些提示可能不可用或不自然。因此,需要一种更自然、更可靠的基于脑电信号的个体识别方法。

核心思路:论文的核心思路是设计一种“无提示”的脑电想象语音范式。即,在没有任何外部视觉或听觉提示的情况下,让受试者自主地从预定义的词汇列表中选择词语,并在脑海中想象这些词语的发音。这种方法旨在模拟更自然、更真实的认知过程,从而提高个体识别的准确性和鲁棒性。

技术框架:整体框架包括数据采集和分类两个主要阶段。在数据采集阶段,受试者参与多个会话,每个会话包含多个试验。在每个试验中,受试者从预定义的词汇列表中选择一个词语,并在脑海中想象该词语的发音,同时记录脑电信号。在分类阶段,使用各种机器学习和深度学习模型对脑电信号进行分类,以识别受试者。采用基于会话的留出验证策略,确保模型在不同会话中的泛化能力。

关键创新:该论文的关键创新在于提出了无提示的脑电想象语音范式。与以往依赖外部提示的方法相比,该方法更自然、更贴近实际应用场景。此外,该研究还构建了一个大规模的无提示脑电想象语音数据集,为相关研究提供了宝贵的数据资源。

关键设计:数据集包含来自11名受试者在五个会话中的超过4350个试验。预定义的词汇列表包含具有语义意义的词语。分类模型包括传统机器学习方法(如SVM和XGBoost)以及深度学习模型(如EEG Conformer和Shallow ConvNet)。采用基于会话的留出验证策略,以防止数据泄漏。评估指标为分类准确率。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,在无提示的脑电想象语音范式下,使用各种机器学习和深度学习模型进行个体识别,可以达到高达97.93%的分类准确率。这表明无提示脑电想象语音在个体识别方面具有巨大的潜力,并且优于依赖外部提示的传统方法。该研究结果为脑机接口和生物识别领域的研究提供了新的思路。

🎯 应用场景

该研究成果可应用于脑机接口(BCI)系统中的身份验证和访问控制,例如,用户可以通过想象特定的词语来解锁设备或访问敏感信息。此外,该技术还可用于安全领域,例如,通过分析脑电信号来识别犯罪嫌疑人或验证证人证词。未来,该技术有望应用于医疗康复、人机交互等领域,实现更自然、更安全的交互方式。

📄 摘要(原文)

Electroencephalogram (EEG) signals have emerged as a promising modality for biometric identification. While previous studies have explored the use of imagined speech with semantically meaningful words for subject identification, most have relied on additional visual or auditory cues. In this study, we introduce a cueless EEG-based imagined speech paradigm, where subjects imagine the pronunciation of semantically meaningful words without any external cues. This innovative approach addresses the limitations of prior methods by requiring subjects to select and imagine words from a predefined list naturally. The dataset comprises over 4,350 trials from 11 subjects across five sessions. We assess a variety of classification methods, including traditional machine learning techniques such as Support Vector Machines (SVM) and XGBoost, as well as time-series foundation models and deep learning architectures specifically designed for EEG classification, such as EEG Conformer and Shallow ConvNet. A session-based hold-out validation strategy was employed to ensure reliable evaluation and prevent data leakage. Our results demonstrate outstanding classification accuracy, reaching 97.93%. These findings highlight the potential of cueless EEG paradigms for secure and reliable subject identification in real-world applications, such as brain-computer interfaces (BCIs).