Adaptive Vehicle Speed Classification via BMCNN with Reinforcement Learning-Enhanced Acoustic Processing
作者: Yuli Zhang, Pengfei Fan, Ruiyuan Jiang, Hankang Gu, Dongyao Jia, Xinheng Wang
分类: cs.SD, cs.AI, eess.AS
发布日期: 2025-08-31
💡 一句话要点
提出基于BMCNN和强化学习的自适应车辆速度分类方法以应对交通拥堵问题
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 车辆速度分类 声学信号处理 深度学习 强化学习 智能交通系统
📋 核心要点
- 核心问题:现有的车辆速度分类方法在处理复杂城市交通环境时,准确性和实时性不足,难以满足智能交通系统的需求。
- 方法要点:本文提出的混合框架结合了双分支BMCNN和强化学习,通过声学特征分类车辆速度,并实现了自适应决策。
- 实验或效果:在多个数据集上进行评估,取得了95.99%和92.3%的准确率,并通过早期终止技术实现了1.63倍的处理速度提升。
📝 摘要(中文)
交通拥堵是城市面临的重大挑战,需要智能交通系统进行实时管理。本文提出了一种混合框架,结合深度学习和强化学习用于声学车辆速度分类。双分支BMCNN处理MFCC和小波特征,以捕捉互补的频率模式。增强注意力的DQN自适应选择最少数量的音频帧,并在达到置信度阈值时触发早期决策。在IDMT-Traffic和SZUR-Acoustic(苏州)数据集上的评估显示,准确率分别为95.99%和92.3%,通过早期终止实现了平均处理速度提高1.63倍。与A3C、DDDQN、SA2C、PPO和TD3相比,该方法提供了更优的准确性与效率平衡,适合在异构城市环境中实时部署。
🔬 方法详解
问题定义:本文旨在解决城市交通中车辆速度分类的准确性和实时性问题。现有方法在复杂环境下表现不佳,难以快速响应交通管理需求。
核心思路:提出一种结合深度学习和强化学习的混合框架,通过声学信号处理实现车辆速度的高效分类。设计双分支BMCNN以提取互补特征,并使用强化学习优化决策过程。
技术框架:整体架构包括两个主要模块:双分支BMCNN用于处理MFCC和小波特征,增强注意力的DQN用于自适应选择音频帧并进行决策。流程中,BMCNN提取特征后,DQN根据置信度阈值进行早期决策。
关键创新:最重要的创新在于结合了双分支BMCNN与强化学习,能够在保证分类准确性的同时提升处理速度,显著优于传统方法。
关键设计:在网络结构上,BMCNN采用双分支设计,分别处理不同类型的声学特征。DQN的设计中引入了注意力机制,以优化帧选择和决策过程,确保在达到置信度时快速响应。损失函数和参数设置经过精心调整,以实现最佳性能。
📊 实验亮点
实验结果显示,提出的方法在IDMT-Traffic和SZUR-Acoustic数据集上分别达到了95.99%和92.3%的准确率,且通过早期终止技术实现了1.63倍的处理速度提升。与其他强化学习方法相比,提供了更优的准确性与效率平衡。
🎯 应用场景
该研究的潜在应用领域包括智能交通系统、城市交通管理和自动驾驶技术。通过实时监测和分类车辆速度,可以有效缓解交通拥堵,提高城市交通的运行效率,具有重要的实际价值和社会影响。
📄 摘要(原文)
Traffic congestion remains a pressing urban challenge, requiring intelligent transportation systems for real-time management. We present a hybrid framework that combines deep learning and reinforcement learning for acoustic vehicle speed classification. A dual-branch BMCNN processes MFCC and wavelet features to capture complementary frequency patterns. An attention-enhanced DQN adaptively selects the minimal number of audio frames and triggers early decisions once confidence thresholds are reached. Evaluations on IDMT-Traffic and our SZUR-Acoustic (Suzhou) datasets show 95.99% and 92.3% accuracy, with up to 1.63x faster average processing via early termination. Compared with A3C, DDDQN, SA2C, PPO, and TD3, the method provides a superior accuracy-efficiency trade-off and is suitable for real-time ITS deployment in heterogeneous urban environments.