Predicting Barge Tow Size on Inland Waterways Using Vessel Trajectory Derived Features: Proof of Concept

📄 arXiv: 2510.23994v1 📥 PDF

作者: Geoffery Agorku, Sarah Hernandez, Hayley Hames, Cade Wagner

分类: cs.LG

发布日期: 2025-10-28


💡 一句话要点

提出一种基于AIS数据的机器学习方法,用于预测内河航道驳船数量,提升水域感知能力。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)

关键词: 内河航运 驳船数量预测 AIS数据 机器学习 泊松回归 特征工程 水域感知

📋 核心要点

  1. 现有内河航道驳船数量估计方法依赖人工或传统传感器,成本高昂且难以实时监测。
  2. 该研究利用AIS数据,提取船舶几何、运动和轨迹特征,通过机器学习模型预测驳船数量。
  3. 实验表明,泊松回归模型在密西西比河下游实现了较好的预测精度,MAE为1.92艘驳船。

📝 摘要(中文)

由于驳船的非自航特性和现有监测系统的局限性,准确、实时地估计内河航道上的驳船数量仍然是一个关键挑战。本研究提出了一种新方法,利用船舶自动识别系统(AIS)的跟踪数据,通过机器学习(ML)预测拖运的驳船数量。为了训练和测试模型,从密西西比河下游的卫星图像中手动标注驳船实例。利用时空匹配程序将标记的图像与AIS船舶轨迹进行匹配。创建了一个包含30个AIS衍生特征的综合集合,这些特征捕捉了船舶的几何形状、动态运动和轨迹模式,并使用递归特征消除(RFE)来识别最具预测性的变量。训练并评估了六个回归模型,包括集成、基于核和广义线性方法。泊松回归模型表现最佳,使用12个特征实现了1.92艘驳船的平均绝对误差(MAE)。特征重要性分析表明,捕捉船舶机动性的指标,如航向熵、速度变异性和行程长度,对驳船数量的预测能力最强。该方法为提高海事领域感知(MDA)提供了一种可扩展、易于实施的方法,在船闸调度、港口管理和货运规划方面具有强大的潜在应用。未来的工作将扩展本文提出的概念验证,探索模型在其他具有不同操作和环境条件的内河中的可迁移性。

🔬 方法详解

问题定义:论文旨在解决内河航道驳船数量难以准确、实时估计的问题。现有方法,如人工统计或依赖雷达等传感器,成本高昂,覆盖范围有限,且难以应对复杂环境。因此,需要一种低成本、可扩展的方法来提高内河航运的态势感知能力。

核心思路:论文的核心思路是利用船舶自动识别系统(AIS)数据中蕴含的船舶运动信息,通过机器学习模型学习AIS数据与驳船数量之间的关系。AIS数据覆盖范围广,成本低廉,能够提供船舶的实时位置、速度、航向等信息。通过分析这些信息,可以推断船舶的拖运状态和驳船数量。

技术框架:整体流程包括以下几个阶段:1) 数据收集:收集密西西比河下游的AIS数据和卫星图像。2) 数据标注:手动标注卫星图像中的驳船实例,作为训练数据的标签。3) 数据匹配:使用时空匹配方法将标注的驳船实例与AIS船舶轨迹进行匹配。4) 特征提取:从AIS数据中提取30个特征,包括船舶几何特征、动态运动特征和轨迹模式特征。5) 特征选择:使用递归特征消除(RFE)选择最具预测性的特征子集。6) 模型训练与评估:训练和评估六种回归模型,包括集成模型、基于核的模型和广义线性模型。

关键创新:该研究的关键创新在于:1) 提出了一种基于AIS数据的驳船数量预测方法,无需额外的传感器或人工干预。2) 提出了一个包含30个AIS衍生特征的综合集合,这些特征能够有效捕捉船舶的运动状态和拖运行为。3) 通过特征选择,确定了对驳船数量预测最重要的特征,如航向熵、速度变异性和行程长度。

关键设计:在模型选择方面,尝试了多种回归模型,最终选择了泊松回归模型,因为它更适合处理计数数据。特征选择方面,使用了递归特征消除(RFE)方法,该方法能够有效地选择出最具预测性的特征子集。时空匹配方面,采用了合理的匹配窗口和距离阈值,确保了AIS数据与卫星图像的准确匹配。

📊 实验亮点

实验结果表明,泊松回归模型在预测驳船数量方面表现最佳,使用12个特征实现了1.92艘驳船的平均绝对误差(MAE)。特征重要性分析显示,航向熵、速度变异性和行程长度等反映船舶机动性的指标对驳船数量的预测最为重要。该研究验证了利用AIS数据预测驳船数量的可行性,为内河航运管理提供了新的思路。

🎯 应用场景

该研究成果可应用于内河航运的多个领域,包括船闸调度优化、港口管理效率提升、货运规划的智能化以及水域安全监管的增强。通过准确预测驳船数量,可以更好地分配航运资源,减少拥堵,提高运输效率,并为决策者提供更全面的水域态势信息,从而提升整体的航运安全和经济效益。

📄 摘要(原文)

Accurate, real-time estimation of barge quantity on inland waterways remains a critical challenge due to the non-self-propelled nature of barges and the limitations of existing monitoring systems. This study introduces a novel method to use Automatic Identification System (AIS) vessel tracking data to predict the number of barges in tow using Machine Learning (ML). To train and test the model, barge instances were manually annotated from satellite scenes across the Lower Mississippi River. Labeled images were matched to AIS vessel tracks using a spatiotemporal matching procedure. A comprehensive set of 30 AIS-derived features capturing vessel geometry, dynamic movement, and trajectory patterns were created and evaluated using Recursive Feature Elimination (RFE) to identify the most predictive variables. Six regression models, including ensemble, kernel-based, and generalized linear approaches, were trained and evaluated. The Poisson Regressor model yielded the best performance, achieving a Mean Absolute Error (MAE) of 1.92 barges using 12 of the 30 features. The feature importance analysis revealed that metrics capturing vessel maneuverability such as course entropy, speed variability and trip length were most predictive of barge count. The proposed approach provides a scalable, readily implementable method for enhancing Maritime Domain Awareness (MDA), with strong potential applications in lock scheduling, port management, and freight planning. Future work will expand the proof of concept presented here to explore model transferability to other inland rivers with differing operational and environmental conditions.