Spacecraft inertial parameters estimation using time series clustering and reinforcement learning
作者: Konstantinos Platanitis, Miguel Arana-Catania, Leonardo Capicchiano, Saurabh Upadhyay, Leonard Felicetti
分类: astro-ph.IM, cs.LG, cs.RO
发布日期: 2024-08-06
备注: 6 pages, 3 figures, 1 table. To be presented in ESA - AI for Space (SPAICE)
💡 一句话要点
提出基于时序聚类和强化学习的航天器惯性参数估计方法
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 航天器 惯性参数估计 时间序列聚类 强化学习 在轨服务 多卫星部署
📋 核心要点
- 航天器在轨运行期间,由于各种因素(如燃料消耗、部件展开等)会导致其惯性参数发生变化,精确估计这些参数至关重要。
- 该论文提出了一种基于时间序列聚类和强化学习的机器学习方法,用于估计航天器动态变化的惯性参数。
- 实验结果表明,该算法在多卫星部署场景中表现出良好的鲁棒性,能够有效应对常见的扰动。
📝 摘要(中文)
本文提出了一种机器学习方法,用于估计航天器在运行过程中变化的惯性参数。这些变化可能由有效载荷的多次部署、附件和吊杆的展开、推进剂消耗以及在轨服务和主动碎片移除操作引起。该方法结合了时间序列聚类和强化学习优化的驱动序列,以区分不同的惯性参数集。通过多卫星部署系统的案例评估了该策略的性能,结果表明该算法对这类操作中常见的扰动具有鲁棒性。
🔬 方法详解
问题定义:论文旨在解决航天器在轨运行过程中,由于各种因素导致的惯性参数变化难以精确估计的问题。传统方法可能无法有效应对这些动态变化,并且容易受到扰动的影响。因此,需要一种能够自适应地估计惯性参数,并且对扰动具有鲁棒性的方法。
核心思路:论文的核心思路是利用时间序列聚类来识别不同惯性参数状态,并使用强化学习来优化驱动序列,从而更容易区分不同的惯性参数集。通过聚类分析,可以将相似的航天器运动状态归为一类,然后利用强化学习生成特定的驱动序列,使得不同惯性参数状态下的航天器响应差异最大化,从而提高参数估计的准确性。
技术框架:该方法主要包含两个阶段:1) 时间序列聚类阶段:利用航天器的运动数据(如角速度、角加速度等)进行聚类,将具有相似运动特征的状态归为一类。2) 强化学习优化驱动序列阶段:使用强化学习算法,训练一个智能体,使其能够生成最优的驱动序列,以最大化不同惯性参数状态下的航天器响应差异。这两个阶段相互配合,共同完成航天器惯性参数的估计。
关键创新:该方法的主要创新在于将时间序列聚类和强化学习相结合,用于航天器惯性参数估计。时间序列聚类可以有效地识别不同的运动状态,而强化学习可以优化驱动序列,从而提高参数估计的准确性和鲁棒性。与传统的参数估计方法相比,该方法能够更好地应对航天器在轨运行过程中出现的动态变化和扰动。
关键设计:在时间序列聚类阶段,需要选择合适的聚类算法和特征向量。在强化学习阶段,需要设计合适的奖励函数,以引导智能体学习到最优的驱动序列。奖励函数的设计需要考虑参数估计的准确性和鲁棒性。此外,还需要选择合适的强化学习算法,并调整其参数,以获得最佳的性能。
🖼️ 关键图片
📊 实验亮点
该论文通过多卫星部署系统的案例验证了所提出方法的有效性。实验结果表明,该算法对这类操作中常见的扰动具有鲁棒性,能够准确估计航天器的惯性参数。具体的性能数据(如参数估计误差、鲁棒性指标等)未在摘要中明确给出,但强调了算法在实际应用中的潜力。
🎯 应用场景
该研究成果可应用于多种航天任务,包括多卫星部署、在轨服务、主动碎片移除等。通过精确估计航天器的惯性参数,可以提高姿态控制精度,优化轨道机动策略,从而提升任务的成功率和效率。此外,该方法还可以用于故障诊断和健康管理,及时发现航天器异常,保障其安全运行。
📄 摘要(原文)
This paper presents a machine learning approach to estimate the inertial parameters of a spacecraft in cases when those change during operations, e.g. multiple deployments of payloads, unfolding of appendages and booms, propellant consumption as well as during in-orbit servicing and active debris removal operations. The machine learning approach uses time series clustering together with an optimised actuation sequence generated by reinforcement learning to facilitate distinguishing among different inertial parameter sets. The performance of the proposed strategy is assessed against the case of a multi-satellite deployment system showing that the algorithm is resilient towards common disturbances in such kinds of operations.