Featurized Occupation Measures for Structured Global Search in Numerical Optimal Control
作者: Qi Wei, Jianfeng Tao, Haoyang Tan, Hongyu Nie
分类: math.OC, cs.RO, eess.SY
发布日期: 2026-03-17
💡 一句话要点
提出特征化占用测度(FOM),用于数值最优控制中的结构化全局搜索。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 最优控制 占用测度 Hamilton-Jacobi-Bellman方程 全局优化 特征化 数值方法 机器人控制
📋 核心要点
- 传统数值最优控制方法面临全局性和可扩展性的权衡,HJB方法全局但维度灾难,轨迹优化可扩展但局部。
- 论文提出特征化占用测度(FOM),作为连接轨迹搜索和全局HJB验证的桥梁,实现全局结构化搜索。
- FOM框架支持显式弱形式和隐式采样方法,并利用近似HJB子解作为数值证书指导搜索,保证性能下界。
📝 摘要(中文)
数值最优控制通常分为全局结构化但维度上难以处理的Hamilton-Jacobi-Bellman (HJB)方法,以及可扩展但局部的轨迹优化方法。本文提出特征化占用测度(FOM),这是一种有限维原始-对偶接口,用于占用测度公式,统一了轨迹搜索和全局HJB类型的验证。FOM具有广泛性且数值上易于处理,涵盖了显式弱形式方案和隐式基于模拟器或rollout的采样方法。在该框架内,近似HJB子解充当内在的数值证书,以直接评估和指导原始搜索。我们证明了与精确的无限维占用测度问题渐近一致,并表明对于块状组织的feasible证书,有限维近似保留了具有分块误差和复杂度控制的认证下界。我们还建立了这些下界在时间偏移和有界模型扰动下的持久性。因此,这些结构属性将全局证书转化为灵活、可重用的计算对象,为非线性控制中的证书引导优化建立了系统的基础。
🔬 方法详解
问题定义:数值最优控制问题旨在寻找控制策略,使系统从初始状态转移到目标状态,并最小化给定的成本函数。现有的HJB方法虽然具有全局最优性保证,但计算复杂度随状态空间维度呈指数增长,难以应用于高维系统。而轨迹优化方法虽然可扩展性好,但容易陷入局部最优解,缺乏全局一致性。
核心思路:本文的核心思路是利用占用测度(Occupation Measure)将最优控制问题转化为一个无限维的线性规划问题,然后通过特征化(Featurization)将无限维问题近似为有限维问题。通过这种方式,既保留了全局优化的结构,又降低了计算复杂度。关键在于找到合适的特征,使得有限维近似能够较好地逼近无限维问题。
技术框架:FOM框架包含以下几个主要模块:1) 状态空间和控制空间的离散化或特征化;2) 占用测度的有限维表示,通过选择合适的基函数或特征;3) 原始问题(轨迹优化)和对偶问题(HJB方程)的构建;4) 原始-对偶优化算法,用于求解有限维近似问题;5) 证书验证,利用HJB子解作为数值证书,评估和指导原始搜索。
关键创新:最重要的技术创新点在于特征化占用测度(FOM)的引入,它提供了一个有限维的原始-对偶接口,将轨迹搜索和全局HJB验证统一起来。与传统的轨迹优化方法相比,FOM能够提供全局最优性的近似保证,并利用HJB子解指导搜索方向。与传统的HJB方法相比,FOM通过特征化降低了计算复杂度,使其能够应用于更高维的系统。
关键设计:FOM的关键设计包括:1) 特征函数的选择,需要根据具体问题选择合适的特征函数,以保证有限维近似的精度;2) 原始-对偶优化算法的选择,可以选择线性规划、二次规划等优化算法;3) HJB子解的构造方法,可以使用数值方法或机器学习方法近似求解HJB方程;4) 误差控制方法,需要对特征化引入的误差进行分析和控制,以保证全局最优性的近似保证。
🖼️ 关键图片
📊 实验亮点
论文证明了FOM与精确的无限维占用测度问题渐近一致,并表明对于块状组织的feasible证书,有限维近似保留了具有分块误差和复杂度控制的认证下界。此外,论文还建立了这些下界在时间偏移和有界模型扰动下的持久性,表明FOM具有较强的鲁棒性。
🎯 应用场景
该研究成果可应用于机器人运动规划、自动驾驶、飞行器控制等领域。通过FOM框架,可以设计出具有全局最优性保证的控制策略,提高系统的安全性和可靠性。此外,FOM还可以用于验证现有控制策略的性能,并提供改进方向。
📄 摘要(原文)
Numerical optimal control is commonly divided between globally structured but dimensionally intractable Hamilton-Jacobi-Bellman (HJB) methods and scalable but local trajectory optimization. We introduce the Featurized Occupation Measure (FOM), a finite-dimensional primal-dual interface for the occupation-measure formulation that unifies trajectory search and global HJB-type certification. FOM is broad yet numerically tractable, covering both explicit weak-form schemes and implicit simulator- or rollout-based sampling methods. Within this framework, approximate HJB subsolutions serve as intrinsic numerical certificates to directly evaluate and guide the primal search. We prove asymptotic consistency with the exact infinite-dimensional occupation-measure problem, and show that for block-organized feasible certificates, finite-dimensional approximation preserves certified lower bounds with blockwise error and complexity control. We also establish persistence of these lower bounds under time shifts and bounded model perturbations. Consequently, these structural properties render global certificates into flexible, reusable computational objects, establishing a systematic basis for certificate-guided optimization in nonlinear control.