Physiologically Grounded Driver Behavior Classification: SHAP-Driven Elite Feature Selection and Hybrid Gradient Boosting for Multimodal Physiological Signals

📄 arXiv: 2605.05120v1 📥 PDF

作者: Sahar Askari, Mohammad Mahdi Mirza Ali Mohammadi, Fatemeh Ensafdoust, Amin Golnari, Saeid Sanei

分类: cs.LG, eess.SP

发布日期: 2026-05-06


💡 一句话要点

提出基于SHAP特征选择和混合梯度提升的驾驶行为分类框架,利用多模态生理信号实现高性能和可解释性。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 驾驶行为识别 多模态生理信号 SHAP值 特征选择 梯度提升 模型集成 可解释性

📋 核心要点

  1. 现有驾驶行为识别方法在高维生理信号处理和多模态融合方面存在挑战,难以兼顾性能和可解释性。
  2. 该论文提出基于SHAP的特征选择方法,并结合XGBoost和LightGBM的混合梯度提升模型,实现驾驶行为的准确分类。
  3. 实验结果表明,该方法在驾驶行为分类任务上取得了显著的性能提升,并提供了对模型决策过程的生理学解释。

📝 摘要(中文)

本研究提出了一种可解释且可扩展的框架,用于从多模态生理信号中解码驾驶行为。我们利用包含同步脑电图(EEG)、肌电图(EMG)和皮肤电反应(GSR)信号的大规模多模态生理驾驶行为数据集。该方法包括严格的预处理,然后是针对时域、频域和衍生生理指标的领域特定特征提取流程。为了解决高维度问题,我们采用基于SHAP的精英特征选择,保留前250个特征,以减少计算开销,同时保持预测能力。使用Optuna通过贝叶斯优化进行极端梯度提升(XGBoost)和轻量级梯度提升机(LightGBM)模型的超参数优化。最后,构建加权软投票集成,以利用两种梯度提升框架的互补优势。结果表明,所提出的集成实现了80.91%的测试准确率和0.79的宏F1分数,显著优于单模态基线和传统机器学习模型。消融研究证实,与最佳单模态(EEG)相比,性能提升了8%,验证了多模态融合的必要性。SHAP分析进一步验证了模型的生理合理性,表明脑电图贡献了大部分预测权重,GSR和EMG特征为高唤醒和运动密集型操作提供了关键的区分信号。

🔬 方法详解

问题定义:论文旨在解决驾驶行为分类问题,即如何利用多模态生理信号(EEG、EMG、GSR)准确识别驾驶员的行为状态。现有方法在高维生理信号处理和多模态融合方面存在挑战,难以兼顾性能和可解释性,并且计算复杂度较高。

核心思路:论文的核心思路是利用SHAP值进行特征选择,降低特征维度,然后结合XGBoost和LightGBM两种梯度提升模型的优势,构建一个高性能且可解释的集成模型。通过SHAP值选择的特征能够保留重要的生理信息,同时降低计算负担。集成模型能够利用不同模型的互补性,提高分类准确率。

技术框架:整体框架包括以下几个主要阶段:1) 数据预处理:对原始生理信号进行滤波、降噪等处理。2) 特征提取:从时域、频域和生理指标等方面提取特征。3) 特征选择:使用SHAP值选择最重要的250个特征。4) 模型训练:使用贝叶斯优化分别训练XGBoost和LightGBM模型。5) 模型集成:使用加权软投票方法集成两个模型。6) 模型评估:在测试集上评估模型的性能。

关键创新:论文的关键创新在于:1) 提出了一种基于SHAP值的特征选择方法,能够有效地降低特征维度,同时保留重要的生理信息。2) 构建了一个XGBoost和LightGBM的混合梯度提升集成模型,能够利用两种模型的互补优势,提高分类准确率。3) 结合SHAP分析,提供了对模型决策过程的生理学解释,增强了模型的可解释性。

关键设计:在特征选择阶段,使用SHAP值评估每个特征的重要性,并选择前250个特征。在模型训练阶段,使用Optuna进行贝叶斯优化,自动搜索XGBoost和LightGBM的最佳超参数。在模型集成阶段,使用加权软投票方法,根据模型在验证集上的性能确定每个模型的权重。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,所提出的集成模型在驾驶行为分类任务上取得了80.91%的测试准确率和0.79的宏F1分数,显著优于单模态基线和传统机器学习模型。与最佳单模态(EEG)相比,性能提升了8%,验证了多模态融合的有效性。SHAP分析结果表明,EEG信号贡献了大部分预测权重,GSR和EMG信号为高唤醒和运动密集型操作提供了关键的区分信号。

🎯 应用场景

该研究成果可应用于智能驾驶辅助系统,通过实时监测驾驶员的生理状态,预测其驾驶行为,从而提供个性化的安全提醒和干预。此外,该技术还可用于驾驶员疲劳检测、情绪识别等领域,提升驾驶安全性,并为自动驾驶系统的开发提供参考。

📄 摘要(原文)

An interpretable and scalable framework for decoding driving behaviors from multimodal physiological signals is proposed in this study. We utilize multimodal physiological driving behavior large-scale dataset comprising synchronized electroencephalogram (EEG), electromyography (EMG), and galvanic skin response (GSR) signals. Our approach involves rigorous preprocessing followed by a domain-specific feature extraction pipeline targeting time-domain, frequency-domain, and derived physiological indices. To address high dimensionality, we employ SHAP-based elite feature selection, retaining the top 250 features to reduce computational overhead while preserving predictive power. Hyperparameter optimization for extreme gradient boosting (XGBoost) and light gradient boosting machine (LightGBM) models is conducted using Bayesian optimization via Optuna. Finally, a weighted soft-voting ensemble is constructed to leverage the complementary strengths of both gradient boosting frameworks. The results demonstrate that the proposed ensemble achieves a test accuracy of 80.91% and a macro-F1 score of 0.79, significantly outperforming single-modality baselines and traditional machine learning models. Ablation studies confirm an 8% performance gain over the best single modality (EEG), validating the necessity of multimodal fusion. SHAP analysis further validates the physiological plausibility of the model, revealing that the EEG contributes the majority of predictive weight, GSR and EMG features provide critical discriminatory signals for high-arousal and motor-intensive maneuvers.