ADAPT: A Self-Calibrating Proactive Autoscaler for Container Orchestration

📄 arXiv: 2605.15788v1 📥 PDF

作者: Himanshu Singh Baghel

分类: cs.DC, cs.LG

发布日期: 2026-05-15

备注: 9 pages, 5 figures, 3 tables. Includes reproducible simulation framework for proactive Kubernetes autoscaling with adaptive cold-start estimation and MPC-based scaling. Source code and experiment configurations available at: https://github.com/Himanshu21035/autoscaling_research


💡 一句话要点

ADAPT:一种自校准的主动容器编排自动伸缩器

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 容器编排 自动伸缩 模型预测控制 配置延迟 自适应控制

📋 核心要点

  1. 现有容器编排自动伸缩方案难以准确预测配置延迟,导致伸缩决策滞后或资源浪费。
  2. ADAPT通过在线EWMA估计器动态跟踪冷启动时间,并将其融入模型预测控制器的规划范围。
  3. 实验表明,ADAPT在多种工作负载下显著降低了服务水平协议(SLA)违规率,优于传统方法。

📝 摘要(中文)

容器化工作负载的主动自动伸缩依赖于对配置延迟的了解,即从伸缩决策到新容量准备好服务流量之间的时间。实际上,这种冷启动持续时间在不同环境之间,甚至在连续的横向扩展事件之间,都可能存在显著差异。我们提出了ADAPT(预测定时的自适应持续时间近似),这是一种在线EWMA估计器,可在运行时跟踪冷启动持续时间。ADAPT将动态规划范围FH-OPT输入到模型预测控制器(MPC)中,该控制器优化滚动窗口上的副本数量。这些组件共同构成了一个闭环主动自动伸缩设计,该设计根据测量的配置延迟来调整其前瞻性。在三种策略(MPC+LSTM、MPC+Prophet、HPA)和六种具有五个随机种子的工作负载原型上进行评估,MPC+LSTM在所有工作负载上的SLA违规率均低于5%,而反应式HPA为7-19%,MPC+Prophet在双峰流量上高达28.7%。

🔬 方法详解

问题定义:容器编排系统中的自动伸缩面临配置延迟不确定性的挑战。传统的反应式自动伸缩策略对突发流量响应迟缓,而预测式方法依赖于准确的配置延迟估计。然而,实际环境中配置延迟会随时间变化,导致预测不准确,影响服务质量和资源利用率。现有方法难以有效应对这种动态变化,容易造成资源浪费或SLA违规。

核心思路:ADAPT的核心思路是实时自校准配置延迟估计,并将其融入到模型预测控制器的规划范围中。通过在线学习配置延迟的变化,ADAPT能够动态调整预测模型,从而更准确地预测未来的资源需求。这种自适应的方法能够有效应对配置延迟的不确定性,提高自动伸缩的性能。

技术框架:ADAPT包含两个主要组件:ADAPT(自适应持续时间近似)和FH-OPT(动态规划范围优化)。ADAPT使用在线EWMA估计器跟踪运行时冷启动持续时间。FH-OPT将ADAPT估计的配置延迟作为输入,动态调整模型预测控制器(MPC)的规划范围。MPC在滚动窗口上优化副本数量,以满足未来的资源需求。整个系统形成一个闭环控制系统,根据实际的配置延迟进行自适应调整。

关键创新:ADAPT的关键创新在于其自校准的配置延迟估计方法。与传统的静态配置延迟假设不同,ADAPT能够实时跟踪配置延迟的变化,并将其融入到预测模型中。这种自适应的方法能够有效应对配置延迟的不确定性,提高自动伸缩的性能。此外,动态规划范围的引入使得MPC能够更好地权衡短期和长期的资源需求。

关键设计:ADAPT使用EWMA(指数加权移动平均)来估计配置延迟。EWMA的平滑因子是一个关键参数,需要根据实际环境进行调整。FH-OPT根据ADAPT估计的配置延迟动态调整MPC的规划范围。MPC使用LSTM或Prophet等时间序列模型来预测未来的资源需求。MPC的目标函数通常包括资源利用率、SLA违规率和伸缩成本等因素。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,ADAPT在多种工作负载下显著降低了SLA违规率。例如,在使用MPC+LSTM策略时,ADAPT在所有工作负载上的SLA违规率均低于5%,而反应式HPA为7-19%,MPC+Prophet在双峰流量上高达28.7%。这表明ADAPT能够有效应对配置延迟的不确定性,提高自动伸缩的性能。

🎯 应用场景

ADAPT可应用于各种容器化应用场景,例如Web服务、微服务架构和大数据处理。它能够提高资源利用率,降低服务延迟,并减少运维成本。ADAPT的自适应特性使其能够适应不同的环境和工作负载,具有广泛的应用前景。未来,ADAPT可以进一步扩展到支持更复杂的伸缩策略和资源类型。

📄 摘要(原文)

Proactive autoscaling for containerized workloads depends on knowing the provisioning delay, i.e., the time between a scaling decision and the moment new capacity is ready to serve traffic. In practice, this cold-start duration can vary substantially across environments and even across consecutive scale-out events. We present ADAPT (Adaptive Duration Approximation for Predictive Timing), an online EWMA estimator that tracks coldstart duration at runtime. ADAPT feeds a dynamic planning horizon, FH-OPT, into a Model Predictive Controller (MPC) that optimizes replica counts over a rolling window. Together, these components form a closed-loop proactive autoscaling design that adapts its lookahead based on measured provisioning delay. Evaluated across three policies (MPC+LSTM, MPC+Prophet, HPA) and six workload archetypes with five random seeds, MPC+LSTM achieves below 5% SLA violation on all workloads, compared with 7-19% for reactive HPA and up to 28.7% for MPC+Prophet on bimodal traffic.