Best-Arm Identification-Based Trust Region Selection for Bayesian Optimization on Multimodal Functions

📄 arXiv: 2605.31050v1 📥 PDF

作者: Nobuo Namura, Sho Takemori

分类: cs.LG

发布日期: 2026-05-29

备注: 19 pages, 13 figures


💡 一句话要点

提出基于最佳臂识别的信赖域选择贝叶斯优化方法,用于解决多峰函数优化问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 贝叶斯优化 信赖域 最佳臂识别 多峰优化 全局优化

📋 核心要点

  1. 传统贝叶斯优化在多峰或高维问题中性能下降,难以找到全局最优解。
  2. 该方法结合最佳臂识别与信赖域贝叶斯优化,通过预测优化轨迹来选择最优区域。
  3. 理论分析表明该方法收敛速度更快,实验证明其在合成和真实数据集上的有效性。

📝 摘要(中文)

基于高斯过程的贝叶斯优化(BO)是解决昂贵黑盒优化问题的常用方法,但其性能在复杂的多峰或高维问题上通常会下降。基于信赖域的BO通过关注局部区域来缓解这个问题,最近的研究表明,选择有效的区域可以被形式化为一个多臂老虎机问题。我们提出了一个轨迹感知框架,该框架将最佳臂识别(BAI)与基于信赖域的BO相结合,以有效地解决多峰优化问题。我们的方法外推多个局部初始化优化器的优化轨迹,以预测它们的最终性能,并通过BAI逐步消除次优候选者。我们从理论上证明,在温和的假设下,所提出的BAI引导的BO比传统的BO更快地收敛到全局最优,并通过对合成和真实世界基准的广泛实验证明了其有效性。

🔬 方法详解

问题定义:论文旨在解决多峰函数优化问题,即目标函数存在多个局部最优解,传统的贝叶斯优化方法容易陷入局部最优,难以找到全局最优解。现有方法,如标准贝叶斯优化,在高维或复杂函数上效率较低,需要大量的函数评估才能找到较好的解。

核心思路:论文的核心思路是将信赖域选择问题建模为多臂老虎机问题,并利用最佳臂识别(BAI)算法来选择最有希望的信赖域。通过对多个局部初始化优化器的优化轨迹进行外推,预测它们在各自信赖域内的最终性能,并利用BAI算法逐步淘汰性能较差的信赖域,从而集中资源在更有可能找到全局最优解的区域。

技术框架:该方法包含以下主要阶段:1) 局部初始化:在搜索空间中随机或按照一定策略初始化多个局部优化器,每个优化器对应一个信赖域。2) 轨迹外推:对每个局部优化器的优化轨迹进行外推,预测其在各自信赖域内的最终性能。3) 最佳臂识别:利用BAI算法,根据预测的性能逐步淘汰性能较差的信赖域。4) 信赖域更新:根据BAI的结果,更新信赖域的选择,将更多的资源分配给更有希望的区域。5) 迭代优化:重复上述步骤,直到满足停止条件。

关键创新:该方法最重要的创新点在于将最佳臂识别算法引入到信赖域贝叶斯优化中,通过轨迹外推和BAI算法,能够更有效地选择信赖域,从而提高全局优化效率。与传统的信赖域方法相比,该方法能够自适应地调整信赖域的选择,避免了手动调整参数的麻烦。

关键设计:轨迹外推方法的设计是关键,需要选择合适的模型来预测优化器的最终性能。BAI算法的选择也很重要,需要根据问题的特点选择合适的算法,例如,可以使用UCB、Thompson Sampling等算法。此外,信赖域的大小和形状也需要仔细设计,以保证优化器能够在信赖域内充分探索。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在合成数据集和真实数据集上均优于传统的贝叶斯优化方法。例如,在某些多峰函数上,该方法能够以更少的函数评估次数找到全局最优解,并且收敛速度更快。与基线方法相比,该方法在全局优化性能方面有显著提升。

🎯 应用场景

该研究成果可应用于各种需要优化昂贵黑盒函数的领域,例如超参数优化、材料设计、药物发现、机器人控制等。通过更有效地找到全局最优解,可以显著提高这些领域的效率和性能,加速相关产品的研发过程,降低成本。

📄 摘要(原文)

Gaussian process-based Bayesian optimization (BO) is a popular approach for expensive black-box optimization, but its performance often degrades on complex multimodal or high-dimensional problems. Trust region-based BO mitigates this issue by focusing on local regions, and recent studies suggest that selecting an effective region can be formulated as a multi-armed bandit problem. We propose a trajectory-aware framework that integrates best-arm identification (BAI) with trust region-based BO to efficiently solve multimodal optimization problems. Our method extrapolates the optimization trajectories of multiple locally initialized optimizers to predict their final performance and progressively eliminates suboptimal candidates via BAI. We theoretically show that the proposed BAI-guided BO converges faster to the global optimum than conventional BO under mild assumptions, and demonstrate its effectiveness through extensive experiments on synthetic and real-world benchmarks.