Combining Machine Learning and Sampling-Based Search for Multi-Goal Motion Planning with Dynamics

📄 arXiv: 2503.20530v1 📥 PDF

作者: Yuanjie Lu, Erion Plaku

分类: cs.RO

发布日期: 2025-03-26

备注: 10 pages, 2025 International Joint Conference on Artificial Intelligence (IJCAI 2025)


💡 一句话要点

结合机器学习与采样搜索,解决动态约束下多目标运动规划问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 多目标运动规划 动态约束 机器学习 采样搜索 旅行商问题 机器人 路径规划

📋 核心要点

  1. 现有方法在复杂环境下,难以高效解决具有动态约束的多目标运动规划问题。
  2. 该方法结合机器学习预测单目标规划代价,指导采样搜索,优化多目标访问顺序。
  3. 实验表明,该方法在障碍物丰富的环境中,对车辆模型具有良好的计算效率和可扩展性。

📝 摘要(中文)

本文研究了非结构化、障碍物丰富的环境中,具有动态约束的多目标运动规划问题。机器人需要在避开碰撞的同时到达多个目标区域。为了高效地找到解决方案,本文结合了机器学习、旅行商问题(TSP)和基于采样的运动规划。该方法通过添加无碰撞且满足动力学可行性的轨迹作为分支来扩展运动树。TSP求解器用于计算每个节点的访问剩余目标的顺序,利用代价矩阵。该方法的一个重要方面是,它利用机器学习构建代价矩阵,将单目标运动规划问题的运行时间和距离预测结合起来。在运动树扩展过程中,优先考虑与低成本路径相关的节点。在具有丰富障碍物的环境中,对车辆模型进行的实验证明了该方法的计算效率和可扩展性。

🔬 方法详解

问题定义:论文旨在解决具有动态约束的机器人,在复杂、非结构化环境中,如何高效规划出一条能够依次访问多个目标区域且避开障碍物的可行路径。现有方法在处理此类问题时,往往面临计算复杂度高、难以快速找到可行解的挑战,尤其是在高维状态空间和复杂动力学约束下。

核心思路:论文的核心思路是利用机器学习预测单目标运动规划的代价,并将其融入到基于采样的运动规划框架中。通过学习单目标规划的代价,可以有效地指导采样过程,优先探索更有可能到达目标的区域,从而加速多目标规划的求解。同时,结合旅行商问题(TSP)求解器,优化访问目标的顺序,进一步降低整体规划代价。

技术框架:整体框架包含以下几个主要模块:1) 运动树扩展:以机器人当前状态为根节点,通过采样生成新的状态,并利用运动规划器生成连接这些状态的轨迹。2) 单目标代价预测:利用机器学习模型预测从当前状态到达每个剩余目标的代价(包括时间和距离)。3) TSP求解:使用TSP求解器,基于代价矩阵计算访问剩余目标的最佳顺序。4) 节点优先级排序:根据TSP求解得到的总代价,对运动树中的节点进行优先级排序,优先扩展具有较低总代价的节点。

关键创新:该方法最重要的创新点在于将机器学习引入到多目标运动规划中,用于预测单目标运动规划的代价。与传统的基于采样的运动规划方法相比,该方法能够更有效地利用先验知识,指导采样过程,从而提高规划效率。此外,将运行时间和距离预测结合起来构建代价矩阵,能够更准确地反映实际规划代价。

关键设计:论文的关键设计包括:1) 机器学习模型的选择和训练:选择合适的机器学习模型(例如神经网络)来预测单目标运动规划的代价,并使用大量数据进行训练。2) 代价矩阵的构建:将运行时间和距离预测结合起来,构建代价矩阵,用于TSP求解。3) 节点优先级排序策略:根据TSP求解得到的总代价,对运动树中的节点进行优先级排序,并设置合适的阈值,以控制运动树的扩展。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在障碍物丰富的环境中,对车辆模型具有良好的计算效率和可扩展性。与传统的基于采样的运动规划方法相比,该方法能够显著减少规划时间,并找到更优的路径。具体的性能数据和对比基线在论文中进行了详细的展示。

🎯 应用场景

该研究成果可应用于自动驾驶、物流机器人、无人机等领域,解决复杂环境下多目标任务的运动规划问题。例如,在自动驾驶中,车辆需要在避开障碍物的同时,依次访问多个目的地;在物流机器人中,机器人需要在仓库中高效地完成多个拣货任务。该方法能够提高运动规划的效率和可靠性,具有重要的实际应用价值。

📄 摘要(原文)

This paper considers multi-goal motion planning in unstructured, obstacle-rich environments where a robot is required to reach multiple regions while avoiding collisions. The planned motions must also satisfy the differential constraints imposed by the robot dynamics. To find solutions efficiently, this paper leverages machine learning, Traveling Salesman Problem (TSP), and sampling-based motion planning. The approach expands a motion tree by adding collision-free and dynamically-feasible trajectories as branches. A TSP solver is used to compute a tour for each node to determine the order in which to reach the remaining goals by utilizing a cost matrix. An important aspect of the approach is that it leverages machine learning to construct the cost matrix by combining runtime and distance predictions to single-goal motion-planning problems. During the motion-tree expansion, priority is given to nodes associated with low-cost tours. Experiments with a vehicle model operating in obstacle-rich environments demonstrate the computational efficiency and scalability of the approach.