Multimodal Classification Network Guided Trajectory Planning for Four-Wheel Independent Steering Autonomous Parking Considering Obstacle Attributes
作者: Jingjia Teng, Yang Li, Yougang Bian, Manjiang Hu, Yingbai Hu, Guofa Li, Jianqiang Wang
分类: cs.RO
发布日期: 2025-12-21 (更新: 2026-01-04)
💡 一句话要点
提出融合多模态感知的四轮独立转向自动泊车轨迹规划方法,提升复杂环境适应性。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱三:空间感知与语义 (Perception & Semantics) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 自动泊车 四轮独立转向 多模态感知 轨迹规划 最优控制 障碍物属性 风险评估
📋 核心要点
- 现有自动泊车规划器忽略了障碍物属性,导致效率低下或规划失败,尤其是在狭窄空间中。
- 该方法融合视觉和车辆状态信息,利用多模态感知网络理解场景,并根据场景复杂度调整规划策略。
- 实验表明,该框架能为四轮独立转向车辆生成安全、高效和平滑的轨迹,尤其是在复杂受限环境中。
📝 摘要(中文)
本文提出了一种新颖的多模态轨迹规划框架,用于四轮独立转向(4WIS)车辆的自动泊车。该框架利用神经网络进行场景感知,结合4WIS混合A*搜索生成初始轨迹,并使用最优控制问题(OCP)进行轨迹优化。具体而言,采用融合视觉信息和车辆状态的多模态感知网络来捕获语义和上下文场景理解,使规划器能够根据场景复杂度(简单或困难任务)调整策略。对于困难任务,引入引导点将复杂任务分解为局部子任务,提高搜索效率。同时,将4WIS车辆的多种转向模式(阿克曼、对角和零转)作为运动学可行的运动原语。此外,分层障碍物处理策略将障碍物分类为“不可穿越”、“可穿越”和“可碾压”,并将其纳入节点扩展过程,将障碍物属性与规划动作显式关联,从而实现高效决策。为了解决具有运动不确定性的动态障碍物问题,引入概率风险场模型,构建风险感知的驾驶走廊,作为OCP中的线性碰撞约束。实验结果表明,该框架能够为4WIS车辆生成安全、高效和平滑的轨迹,尤其是在受限环境中。
🔬 方法详解
问题定义:现有自动泊车系统在处理复杂环境时,通常忽略障碍物的属性(如是否可穿越或碾压),导致规划的轨迹效率低下,甚至无法找到可行路径。尤其对于四轮独立转向车辆,其多种转向模式未被充分利用。此外,动态障碍物的不确定性也给轨迹规划带来了挑战。
核心思路:本文的核心思路是融合多模态感知信息,利用神经网络理解场景,并根据场景的复杂程度自适应地调整规划策略。通过将障碍物属性纳入规划过程,并结合四轮独立转向车辆的多种转向模式,提高规划效率和成功率。同时,采用概率风险场模型处理动态障碍物的不确定性。
技术框架:该框架主要包含三个阶段:1) 多模态场景感知:利用融合视觉信息和车辆状态的神经网络进行场景理解,判断任务的难易程度,并识别障碍物的属性。2) 轨迹生成:对于困难任务,引入引导点将复杂任务分解为局部子任务,并利用4WIS混合A*搜索生成初始轨迹,其中考虑了车辆的多种转向模式。3) 轨迹优化:利用最优控制问题(OCP)对初始轨迹进行优化,其中将障碍物属性和动态障碍物的风险信息作为约束条件。
关键创新:该方法最重要的创新点在于将多模态感知信息与轨迹规划相结合,并显式地考虑了障碍物的属性。通过多模态感知网络,系统能够理解场景的复杂程度,并根据场景的特点调整规划策略。此外,将障碍物属性纳入规划过程,使得系统能够做出更明智的决策,例如选择碾压低矮障碍物以提高效率。
关键设计:多模态感知网络的设计是关键。该网络融合了视觉信息和车辆状态信息,并采用多分支结构来提取不同模态的特征。障碍物属性的分类也至关重要,论文将障碍物分为“不可穿越”、“可穿越”和“可碾压”三类,并根据不同的类别采取不同的处理方式。概率风险场模型的参数设置也需要仔细调整,以平衡安全性和效率。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该框架能够为四轮独立转向车辆生成安全、高效和平滑的轨迹。与传统方法相比,该方法在复杂环境下的规划成功率更高,且轨迹长度更短。具体性能提升数据未知,但摘要强调了在受限环境下的优势。
🎯 应用场景
该研究成果可应用于各种自动泊车场景,尤其是在狭窄、拥挤和复杂的环境中。通过提高自动泊车的效率和安全性,可以提升用户体验,并降低事故风险。此外,该方法还可以扩展到其他自动驾驶任务中,例如自动驾驶出租车和物流车辆。
📄 摘要(原文)
Four-wheel Independent Steering (4WIS) vehicles have attracted increasing attention for their superior maneuverability. Human drivers typically choose to cross or drive over the low-profile obstacles (e.g., plastic bags) to efficiently navigate through narrow spaces, while existing planners neglect obstacle attributes, leading to suboptimal efficiency or planning failures. To address this issue, we propose a novel multimodal trajectory planning framework that employs a neural network for scene perception, combines 4WIS hybrid A* search to generate a warm start, and utilizes an optimal control problem (OCP) for trajectory optimization. Specifically, a multimodal perception network fusing visual information and vehicle states is employed to capture semantic and contextual scene understanding, enabling the planner to adapt the strategy according to scene complexity (hard or easy task). For hard tasks, guided points are introduced to decompose complex tasks into local subtasks, improving the search efficiency. The multiple steering modes of 4WIS vehicles, Ackermann, diagonal, and zero-turn, are also incorporated as kinematically feasible motion primitives. Moreover, a hierarchical obstacle handling strategy, which categorizes obstacles as "non-traversable", "crossable", and "drive-over", is incorporated into the node expansion process, explicitly linking obstacle attributes to planning actions to enable efficient decisions. Furthermore, to address dynamic obstacles with motion uncertainty, we introduce a probabilistic risk field model, constructing risk-aware driving corridors that serve as linear collision constraints in OCP. Experimental results demonstrate the proposed framework's effectiveness in generating safe, efficient, and smooth trajectories for 4WIS vehicles, especially in constrained environments.