BCI-Based Assessment of Ocular Response Time Using Dynamic Time Warping Leveraging an RDWT-Driven Deep Neural Framework

📄 arXiv: 2605.14883v1 📥 PDF

作者: Shantanu Sarkar, Sai Shashank Gandavarapu, Jeff Feng, Saurabh Prasad, Reza Khanbabaie, Jose L. Contreras-Vidal

分类: eess.SP, cs.HC, cs.LG

发布日期: 2026-05-14

备注: Submitted to IEEE SMC 2026 (under review)


💡 一句话要点

提出基于RDWT驱动的深度神经网络框架,结合动态时间规整,用于脑外伤患者眼动反应时评估。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 脑机接口 轻度创伤性脑损伤 眼动追踪 深度学习 动态时间规整

📋 核心要点

  1. 早期诊断轻度创伤性脑损伤(mTBI)困难,现有方法缺乏有效的眼动功能评估工具。
  2. 利用RDWT提取脑电特征,结合深度学习进行去噪和预测,再用DTW评估眼动反应时间。
  3. 实验表明,小波域滤波能有效去噪,DTW指标能区分个体差异,追踪任务对区分时间差异有价值。

📝 摘要(中文)

轻度创伤性脑损伤(mTBI)是一种常见但早期难以诊断的疾病。眼动功能障碍是mTBI的一个公认指标。本文提出了一个初步框架,该框架将脑电图(EEG)与基于增强现实(AR)的前庭/眼动运动筛查(VOMS)任务相结合,以估计个体化的眼动反应时间。预处理后的EEG信号通过带通滤波和平均参考进行分析,并使用冗余离散小波变换(RDWT)驱动的深度神经网络框架进行处理。RDWT系数经过可训练的零相位卷积滤波,并通过逆RDWT重建到时域,然后使用2D卷积层和基于卷积LSTM的解码进行通道级的时间和空间滤波。消融研究表明,小波域滤波是一种有效的去噪策略,可以提高预测性能。使用Pearson相关性(>= 0.5)验证了滑动窗口预测,随后使用动态时间规整(DTW)来估计眼动反应时间。DTW导出的指标揭示了所有VOMS任务中显著的个体间差异,并得到了Mann-Whitney U检验的支持。互相关分析进一步揭示了任务相关的时间行为:追踪任务表现出反应性跟踪,而扫视表现出预期性反应。总的来说,结果强调了追踪任务对于区分时间差异的价值,并证明了基于RDWT的EEG特征与DTW指标相结合用于多模态mTBI评估的潜力。

🔬 方法详解

问题定义:论文旨在解决轻度创伤性脑损伤(mTBI)早期诊断困难的问题,特别是缺乏有效且便携的工具来评估眼动功能障碍。现有的诊断方法往往依赖于主观评估或复杂的实验室设备,难以进行快速、客观的评估。因此,开发一种能够准确评估眼动反应时间,并能反映潜在神经生理机制的工具至关重要。

核心思路:论文的核心思路是将脑电图(EEG)与增强现实(AR)技术相结合,通过VOMS任务诱发眼动反应,并利用RDWT驱动的深度神经网络框架分析EEG信号,提取与眼动反应相关的特征。随后,使用动态时间规整(DTW)来量化眼动反应时间,从而实现对mTBI患者眼动功能的客观评估。这种方法结合了神经生理数据和行为数据,能够更全面地了解mTBI对眼动控制的影响。

技术框架:整体框架包括以下几个主要阶段:1) 数据采集:使用AR设备进行VOMS任务,同时记录EEG信号。2) 预处理:对EEG信号进行带通滤波和平均参考。3) 特征提取:使用RDWT提取EEG信号的小波系数。4) 深度学习模型:构建基于RDWT系数的深度神经网络,包括可训练的零相位卷积滤波、逆RDWT重建、2D卷积层和卷积LSTM解码。5) 眼动反应时间估计:使用DTW算法量化眼动反应时间。6) 统计分析:使用Mann-Whitney U检验等方法分析不同组别之间的差异。

关键创新:论文的关键创新在于将RDWT与深度学习相结合,用于分析EEG信号。RDWT能够提供多尺度的时频信息,有助于提取与眼动反应相关的特征。此外,可训练的零相位卷积滤波能够有效地去除噪声,提高预测性能。将DTW应用于眼动反应时间的量化,能够更准确地评估个体间的差异。

关键设计:深度神经网络的关键设计包括:1) 使用RDWT提取小波系数作为输入特征。2) 设计可训练的零相位卷积滤波器,用于去除噪声。3) 使用2D卷积层进行通道级的时间和空间滤波。4) 使用卷积LSTM进行序列解码。5) 使用Pearson相关性验证滑动窗口预测的准确性。6) 使用DTW算法计算眼动反应时间,并使用Mann-Whitney U检验进行统计分析。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,基于RDWT的深度神经网络框架能够有效地预测眼动反应时间,Pearson相关性达到>= 0.5。消融研究表明,小波域滤波能够提高预测性能。DTW导出的指标揭示了所有VOMS任务中显著的个体间差异,并得到了Mann-Whitney U检验的支持。互相关分析表明,追踪任务表现出反应性跟踪,而扫视表现出预期性反应,强调了追踪任务对于区分时间差异的价值。

🎯 应用场景

该研究成果可应用于轻度创伤性脑损伤(mTBI)的早期诊断和评估,为临床医生提供客观的眼动功能评估工具。该方法还可扩展到其他神经系统疾病的诊断,例如帕金森病和多发性硬化症。此外,该技术可用于开发便携式、低成本的脑机接口系统,用于康复训练和辅助设备控制。

📄 摘要(原文)

Mild traumatic brain injury (mTBI) is a prevalent condition that remains difficult to diagnose in its early stages. Oculomotor dysfunction is a well-established marker of mTBI, motivating the development of portable tools that capture both eye-movement behavior and underlying neurophysiology. In this work, we present an initial framework that integrates electroencephalogram (EEG) with augmented-reality (AR)-based Vestibular/Ocular Motor Screening (VOMS) tasks to estimate subject-specific ocular response times. Pre-processed EEG signals, obtained through band-pass filtering and average referencing, are analyzed using a Redundant Discrete Wavelet Transform (RDWT)-driven deep neural framework. The RDWT coefficients are subjected to trainable zero-phase convolutional filtering and reconstructed into the time domain via inverse RDWT, followed by channel-wise temporal and spatial filtering using 2D convolution layers and convolutional-LSTM-based decoding. An ablation study demonstrates that wavelet-domain filtering serves as an effective denoising strategy, improving prediction performance. Sliding-window predictions were validated using Pearson correlation (>= 0.5), and Dynamic Time Warping (DTW) was subsequently used to estimate ocular response times. DTW-derived metrics revealed significant inter-subject differences across all VOM tasks, supported by Mann-Whitney U tests. Cross-correlation analysis further revealed task-dependent temporal behaviors: pursuit tasks exhibited reactive tracking, whereas saccades showed anticipatory responses. Overall, the results highlight pursuit tasks as particularly informative for distinguishing timing differences and demonstrate the potential of RDWT-based EEG features combined with DTW metrics for multimodal mTBI assessment.