Global Search for Optimal Low Thrust Spacecraft Trajectories using Diffusion Models and the Indirect Method
作者: Jannik Graebner, Ryne Beeson
分类: eess.SY, cs.LG, math.OC
发布日期: 2025-01-13 (更新: 2025-09-17)
DOI: 10.1007/s40295-025-00535-1
💡 一句话要点
利用扩散模型和间接法进行低推力航天器轨迹全局优化搜索
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 低推力轨迹优化 全局搜索 扩散模型 间接法 航天器任务设计
📋 核心要点
- 长时间低推力轨迹优化计算成本高昂,且局部最优解呈现聚类模式,传统方法难以高效全局搜索。
- 该论文提出将扩散模型与间接法结合,学习解的结构与任务参数的关系,加速全局搜索过程。
- 实验表明,该方法显著提高了搜索效率,对于未见过的推力大小,解的数量提升了一到两个数量级。
📝 摘要(中文)
长时间低推力非线性最优航天器轨迹全局搜索是一个计算和时间密集型问题,其特点是局部最优解中存在聚类模式。在初步任务设计期间,任务参数经常变化,因此轨迹设计者需要为这些新场景高效地生成高质量的控制解。生成式机器学习模型可以学习解的结构如何随条件参数变化,从而加速具有更新参数的任务的全局搜索。本文将最先进的扩散模型与间接法相结合,用于全局搜索框架内的轨迹优化。该框架在圆型限制性三体问题中,针对两种不同复杂度的低推力转移进行了测试。通过生成和分析训练数据集,我们开发了数学关系和技术,以理解这些问题局部最优解的伴随状态域中的复杂结构。扩散模型在此数据上进行训练,并成功加速了两个问题的全局搜索。该模型预测了伴随状态解结构如何基于最大航天器推力大小而变化。使用扩散模型样本作为初始时间的伴随状态来热启动数值求解器,与来自均匀分布和伴随控制变换的样本相比,对于具有未见推力大小的问题,每分钟生成的解的数量增加了一到两个数量级。
🔬 方法详解
问题定义:论文旨在解决长时间低推力航天器轨迹优化中的全局搜索问题。传统方法,如均匀采样,在面对高维度和复杂约束时,效率低下,难以在合理时间内找到全局最优解。此外,任务参数的频繁变动也使得重新进行全局搜索成为一项耗时的工作。
核心思路:论文的核心思路是利用扩散模型学习局部最优解的伴随状态(costate)与任务参数(如最大推力)之间的关系。扩散模型能够生成高质量的伴随状态样本,作为数值求解器的良好初始猜测,从而加速全局搜索过程。通过学习解空间的结构,模型能够预测在新的任务参数下,解应该位于何处,避免了盲目的随机搜索。
技术框架:整体框架包含以下几个主要阶段:1) 生成训练数据集:通过数值求解器生成一系列局部最优解,并记录其伴随状态和对应的任务参数。2) 训练扩散模型:使用生成的训练数据,训练一个条件扩散模型,学习伴随状态与任务参数之间的映射关系。3) 全局搜索:对于新的任务参数,使用训练好的扩散模型生成伴随状态的初始猜测,并将其输入数值求解器进行优化。4) 评估与比较:将该方法与传统的全局搜索方法进行比较,评估其效率和性能。
关键创新:最重要的技术创新点在于将扩散模型应用于航天器轨迹优化问题,并利用其生成高质量的伴随状态初始猜测。与传统的均匀采样或基于伴随控制变换的方法相比,扩散模型能够更好地捕捉解空间的复杂结构,从而显著提高全局搜索的效率。
关键设计:论文的关键设计包括:1) 扩散模型的选择和训练:选择合适的扩散模型架构,并设计合适的损失函数进行训练,以保证生成伴随状态样本的质量。2) 任务参数的编码方式:选择合适的编码方式将任务参数输入扩散模型,以便模型能够有效地学习其与伴随状态之间的关系。3) 数值求解器的选择和配置:选择合适的数值求解器,并设置合适的参数,以保证能够快速收敛到局部最优解。
🖼️ 关键图片
📊 实验亮点
实验结果表明,使用扩散模型生成的伴随状态作为初始猜测,可以显著提高全局搜索的效率。对于具有未见推力大小的问题,与均匀分布采样和伴随控制变换相比,每分钟生成的解的数量增加了一到两个数量级。这表明该方法能够有效地学习解空间的结构,并生成高质量的初始猜测。
🎯 应用场景
该研究成果可应用于航天任务的初步设计阶段,例如行星际转移、轨道维持和星座部署等。通过快速生成高质量的轨迹解,可以缩短任务设计周期,降低成本,并提高任务的鲁棒性。此外,该方法还可以推广到其他类型的优化问题,例如机器人路径规划和控制系统设计。
📄 摘要(原文)
Long time-duration low-thrust nonlinear optimal spacecraft trajectory global search is a computationally and time expensive problem characterized by clustering patterns in locally optimal solutions. During preliminary mission design, mission parameters are subject to frequent changes, necessitating that trajectory designers efficiently generate high-quality control solutions for these new scenarios. Generative machine learning models can be trained to learn how the solution structure varies with respect to a conditional parameter, thereby accelerating the global search for missions with updated parameters. In this work, state-of-the-art diffusion models are integrated with the indirect approach for trajectory optimization within a global search framework. This framework is tested on two low-thrust transfers of different complexity in the circular restricted three-body problem. By generating and analyzing a training data set, we develop mathematical relations and techniques to understand the complex structures in the costate domain of locally optimal solutions for these problems. A diffusion model is trained on this data and successfully accelerates the global search for both problems. The model predicts how the costate solution structure changes, based on the maximum spacecraft thrust magnitude. Warm-starting a numerical solver with diffusion model samples for the costates at the initial time increases the number of solutions generated per minute for problems with unseen thrust magnitudes by one to two orders of magnitude in comparison to samples from a uniform distribution and from an adjoint control transformation.