Crash Severity Analysis of Child Bicyclists using Arm-Net and MambaNet
作者: Shriyank Somvanshi, Rohit Chakraborty, Subasish Das, Anandi K Dutta
分类: cs.LG
发布日期: 2025-03-14
备注: 4 pages, 6 figures, accepted at IEEE CAI 2025
💡 一句话要点
利用ARM-Net和MambaNet分析儿童自行车事故严重程度,MambaNet表现更优。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 儿童自行车事故 事故严重程度预测 深度表格学习 ARM-Net MambaNet SMOTEENN 数据不平衡 交通安全
📋 核心要点
- 儿童自行车骑行者是道路上最脆弱的用户,事故中常遭受重伤或死亡,现有方法难以准确预测事故严重程度。
- 本研究采用ARM-Net和MambaNet两种深度表格学习模型,并结合SMOTEENN技术平衡数据,提升预测精度。
- 实验结果表明,MambaNet在预测致命/严重和无伤亡事故方面优于ARM-Net,验证了该方法在事故严重程度分析中的有效性。
📝 摘要(中文)
本研究分析了2017年至2022年德克萨斯州发生的2394起儿童自行车事故(14岁及以下)。研究采用两种深度表格学习模型(ARM-Net和MambaNet)进行分析。为了解决数据不平衡问题,应用SMOTEENN技术平衡数据集,从而能够准确预测三种事故严重程度:致命/严重(KA)、中度/轻微(BC)和无伤亡(O)。结果表明,MambaNet优于ARM-Net,在KA和O类别中实现了更高的精确率、召回率、F1分数和准确率。两种模型在区分BC事故方面都面临挑战,这归因于其特征的重叠性。这些发现强调了先进表格深度学习方法和平衡数据集在理解事故严重程度方面的价值。虽然存在依赖分类数据等局限性,但未来的研究可以探索连续变量和实时行为数据,以增强预测建模和事故缓解策略。
🔬 方法详解
问题定义:论文旨在解决儿童自行车事故严重程度预测问题。现有方法在处理表格数据时,难以有效捕捉特征之间的复杂关系,且数据不平衡问题会影响预测准确性。
核心思路:论文的核心思路是利用深度表格学习模型ARM-Net和MambaNet,结合SMOTEENN过采样技术平衡数据集,从而提高事故严重程度预测的准确性。MambaNet基于选择性状态空间模型,能够更好地捕捉序列数据中的长期依赖关系,更适合处理表格数据中的复杂特征交互。
技术框架:整体流程包括数据预处理、模型训练和性能评估三个阶段。首先,对原始事故数据进行清洗和特征提取,然后使用SMOTEENN技术平衡数据集。接着,分别训练ARM-Net和MambaNet模型。最后,使用精确率、召回率、F1分数和准确率等指标评估模型的性能。
关键创新:论文的关键创新在于将MambaNet应用于儿童自行车事故严重程度预测,并验证了其优于ARM-Net的性能。MambaNet在处理表格数据方面具有优势,能够更好地捕捉特征之间的非线性关系和长期依赖关系。
关键设计:论文使用了SMOTEENN技术来平衡数据集,该技术结合了SMOTE过采样和ENN欠采样,能够有效解决数据不平衡问题。ARM-Net和MambaNet的网络结构根据具体任务进行了调整,损失函数采用交叉熵损失函数。具体参数设置在论文中未详细说明,属于未知信息。
📊 实验亮点
实验结果表明,MambaNet在预测致命/严重(KA)和无伤亡(O)事故方面表现优于ARM-Net,实现了更高的精确率、召回率、F1分数和准确率。虽然具体数值未在摘要中给出,但结论明确表明MambaNet在特定类别上具有显著优势,验证了其在事故严重程度预测中的有效性。
🎯 应用场景
该研究成果可应用于交通安全领域,帮助政府和相关机构更好地了解儿童自行车事故的风险因素,制定更有效的安全策略。通过预测事故严重程度,可以为事故救援提供决策支持,提高救援效率,降低伤亡率。此外,该方法还可以推广到其他类型的交通事故分析中。
📄 摘要(原文)
Child bicyclists (14 years and younger) are among the most vulnerable road users, often experiencing severe injuries or fatalities in crashes. This study analyzed 2,394 child bicyclist crashes in Texas from 2017 to 2022 using two deep tabular learning models (ARM-Net and MambaNet). To address the issue of data imbalance, the SMOTEENN technique was applied, resulting in balanced datasets that facilitated accurate crash severity predictions across three categories: Fatal/Severe (KA), Moderate/Minor (BC), and No Injury (O). The findings revealed that MambaNet outperformed ARM-Net, achieving higher precision, recall, F1-scores, and accuracy, particularly in the KA and O categories. Both models highlighted challenges in distinguishing BC crashes due to overlapping characteristics. These insights underscored the value of advanced tabular deep learning methods and balanced datasets in understanding crash severity. While limitations such as reliance on categorical data exist, future research could explore continuous variables and real-time behavioral data to enhance predictive modeling and crash mitigation strategies.