Two-component spatiotemporal template for activation-inhibition of speech in ECoG

📄 arXiv: 2412.21178v1 📥 PDF

作者: Eric Easthope

分类: q-bio.NC, cs.CL, cs.LG, eess.AS, eess.SP

发布日期: 2024-12-30


💡 一句话要点

提出基于时空模板的双分量模型,用于脑皮层电活动中语音激活与抑制的分析

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 脑皮层电图 语音活动 感觉运动皮层 主成分分析 时空模板

📋 核心要点

  1. 现有方法难以有效提取脑皮层电活动中语音相关的激活和抑制模式。
  2. 利用主成分分析对感觉运动皮层ECoG数据进行降维,提取关键时空成分。
  3. 实验表明,仅需两个主成分即可有效表示语音运动期间的感觉运动皮层活动。

📝 摘要(中文)

本文利用多通道高密度脑皮层电图(ECoG),研究了受试者在辅音-元音发音任务中的语音活动。结果表明,在感觉运动皮层(SMC)中,单个ECoG通道之间可以观察到先前研究中发现的语音运动期间beta频段活动(12-35 Hz)与高频gamma活动(70-140 Hz)的负相关。在此基础上,本文使用主成分分析,对SMC中会话平均ECoG数据的各个通道的频段能量进行方差建模,并将SMC通道投影到其低维主成分上。通过窗口相关,将两个频段的主成分与各个ECoG通道随时间的相关性进行识别,从而确定语音相关活动与主成分之间的时空关系。感觉运动区域与主成分区域的相关性揭示了一种独特的双分量激活-抑制式语音表示,类似于最近研究表明在全身运动控制、抑制和姿势中具有复杂相互作用的不同局部感觉运动区域。值得注意的是,第三个主成分在所有受试者中均显示出不显著的相关性,表明两个ECoG分量足以表示语音运动期间的SMC活动。

🔬 方法详解

问题定义:论文旨在解决如何从脑皮层电图(ECoG)数据中有效提取与语音相关的激活和抑制模式,并理解这些模式在感觉运动皮层(SMC)中的时空分布。现有方法可能无法充分捕捉不同频段活动之间的复杂关系,以及个体通道之间的差异性。

核心思路:论文的核心思路是利用主成分分析(PCA)对ECoG数据进行降维,提取能够解释数据方差的主要成分。通过分析这些主成分与原始ECoG通道之间的相关性,可以识别出与语音相关的激活和抑制模式,并构建一个低维的时空模板。这种方法能够简化数据分析,突出关键的神经活动模式。

技术框架:整体流程包括以下几个主要阶段: 1. 数据预处理:对多通道高密度ECoG数据进行带通滤波,提取beta (12-35 Hz) 和 gamma (70-140 Hz) 频段的活动。 2. 功率计算:计算每个通道在每个时间点的频段能量。 3. 主成分分析:对SMC区域的通道频段能量数据进行PCA降维,提取主成分。 4. 相关性分析:计算主成分与各个ECoG通道在时间窗口上的相关性,从而确定语音相关活动与主成分之间的时空关系。 5. 结果分析:分析主成分区域与感觉运动区域的相关性,识别激活和抑制模式。

关键创新:论文的关键创新在于提出了一个双分量时空模板,用于表示感觉运动皮层中与语音相关的激活和抑制活动。通过PCA降维,发现仅需两个主成分即可有效表示语音运动期间的SMC活动,简化了对复杂神经活动的理解。此外,论文还揭示了beta和gamma频段活动之间的负相关关系,并将其与感觉运动皮层的特定区域联系起来。

关键设计: * 频段选择:选择beta (12-35 Hz) 和 gamma (70-140 Hz) 频段,因为这些频段与运动控制和感觉处理相关。 * PCA降维:使用PCA将高维ECoG数据降维到低维主成分空间,保留数据的主要方差信息。 * 窗口相关:使用窗口相关来分析主成分与ECoG通道之间随时间变化的关系,捕捉时变的神经活动模式。 * 双分量模型:发现仅需两个主成分即可有效表示SMC活动,简化了模型复杂度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

研究发现,感觉运动皮层中与语音相关的活动可以用两个主成分来表示,这显著简化了对复杂神经活动的建模。实验结果表明,beta和gamma频段活动之间存在负相关关系,并且这些活动与感觉运动皮层的特定区域相关联。第三个主成分在所有受试者中均显示出不显著的相关性,进一步验证了双分量模型的有效性。

🎯 应用场景

该研究成果可应用于开发更精确的脑机接口(BCI)系统,特别是用于语音解码和控制的BCI。通过理解感觉运动皮层中语音相关的神经活动模式,可以设计更有效的算法来解码用户的语音意图,从而帮助言语障碍患者进行交流。此外,该研究还可以为理解运动控制和抑制的神经机制提供新的见解。

📄 摘要(原文)

I compute the average trial-by-trial power of band-limited speech activity across epochs of multi-channel high-density electrocorticography (ECoG) recorded from multiple subjects during a consonant-vowel speaking task. I show that previously seen anti-correlations of average beta frequency activity (12-35 Hz) to high-frequency gamma activity (70-140 Hz) during speech movement are observable between individual ECoG channels in the sensorimotor cortex (SMC). With this I fit a variance-based model using principal component analysis to the band-powers of individual channels of session-averaged ECoG data in the SMC and project SMC channels onto their lower-dimensional principal components. Spatiotemporal relationships between speech-related activity and principal components are identified by correlating the principal components of both frequency bands to individual ECoG channels over time using windowed correlation. Correlations of principal component areas to sensorimotor areas reveal a distinct two-component activation-inhibition-like representation for speech that resembles distinct local sensorimotor areas recently shown to have complex interplay in whole-body motor control, inhibition, and posture. Notably the third principal component shows insignificant correlations across all subjects, suggesting two components of ECoG are sufficient to represent SMC activity during speech movement.