ADAPT: A Self-Calibrating Proactive Autoscaler for Container Orchestration

作者: Himanshu Singh Baghel

分类: cs.DC, cs.LG

发布日期: 2026-05-15

备注: 9 pages, 5 figures, 3 tables. Includes reproducible simulation framework for proactive Kubernetes autoscaling with adaptive cold-start estimation and MPC-based scaling. Source code and experiment configurations available at: https://github.com/Himanshu21035/autoscaling_research

💡 一句话要点

ADAPT：一种自校准的主动容器编排自动伸缩器

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 容器编排 自动伸缩 模型预测控制 配置延迟 自适应控制

📋 核心要点

现有容器编排自动伸缩方案难以准确预测配置延迟，导致伸缩决策滞后或资源浪费。
ADAPT通过在线EWMA估计器动态跟踪冷启动时间，并将其融入模型预测控制器的规划范围。
实验表明，ADAPT在多种工作负载下显著降低了服务水平协议（SLA）违规率，优于传统方法。

📝 摘要（中文）

容器化工作负载的主动自动伸缩依赖于对配置延迟的了解，即从伸缩决策到新容量准备好服务流量之间的时间。实际上，这种冷启动持续时间在不同环境之间，甚至在连续的横向扩展事件之间，都可能存在显著差异。我们提出了ADAPT（预测定时的自适应持续时间近似），这是一种在线EWMA估计器，可在运行时跟踪冷启动持续时间。ADAPT将动态规划范围FH-OPT输入到模型预测控制器（MPC）中，该控制器优化滚动窗口上的副本数量。这些组件共同构成了一个闭环主动自动伸缩设计，该设计根据测量的配置延迟来调整其前瞻性。在三种策略（MPC+LSTM、MPC+Prophet、HPA）和六种具有五个随机种子的工作负载原型上进行评估，MPC+LSTM在所有工作负载上的SLA违规率均低于5%，而反应式HPA为7-19%，MPC+Prophet在双峰流量上高达28.7%。

🔬 方法详解

问题定义：容器编排系统中的自动伸缩面临配置延迟不确定性的挑战。传统的反应式自动伸缩策略对突发流量响应迟缓，而预测式方法依赖于准确的配置延迟估计。然而，实际环境中配置延迟会随时间变化，导致预测不准确，影响服务质量和资源利用率。现有方法难以有效应对这种动态变化，容易造成资源浪费或SLA违规。

核心思路：ADAPT的核心思路是实时自校准配置延迟估计，并将其融入到模型预测控制器的规划范围中。通过在线学习配置延迟的变化，ADAPT能够动态调整预测模型，从而更准确地预测未来的资源需求。这种自适应的方法能够有效应对配置延迟的不确定性，提高自动伸缩的性能。

技术框架：ADAPT包含两个主要组件：ADAPT（自适应持续时间近似）和FH-OPT（动态规划范围优化）。ADAPT使用在线EWMA估计器跟踪运行时冷启动持续时间。FH-OPT将ADAPT估计的配置延迟作为输入，动态调整模型预测控制器（MPC）的规划范围。MPC在滚动窗口上优化副本数量，以满足未来的资源需求。整个系统形成一个闭环控制系统，根据实际的配置延迟进行自适应调整。

关键创新：ADAPT的关键创新在于其自校准的配置延迟估计方法。与传统的静态配置延迟假设不同，ADAPT能够实时跟踪配置延迟的变化，并将其融入到预测模型中。这种自适应的方法能够有效应对配置延迟的不确定性，提高自动伸缩的性能。此外，动态规划范围的引入使得MPC能够更好地权衡短期和长期的资源需求。

关键设计：ADAPT使用EWMA（指数加权移动平均）来估计配置延迟。EWMA的平滑因子是一个关键参数，需要根据实际环境进行调整。FH-OPT根据ADAPT估计的配置延迟动态调整MPC的规划范围。MPC使用LSTM或Prophet等时间序列模型来预测未来的资源需求。MPC的目标函数通常包括资源利用率、SLA违规率和伸缩成本等因素。

🖼️ 关键图片

📊 实验亮点

实验结果表明，ADAPT在多种工作负载下显著降低了SLA违规率。例如，在使用MPC+LSTM策略时，ADAPT在所有工作负载上的SLA违规率均低于5%，而反应式HPA为7-19%，MPC+Prophet在双峰流量上高达28.7%。这表明ADAPT能够有效应对配置延迟的不确定性，提高自动伸缩的性能。

🎯 应用场景

ADAPT可应用于各种容器化应用场景，例如Web服务、微服务架构和大数据处理。它能够提高资源利用率，降低服务延迟，并减少运维成本。ADAPT的自适应特性使其能够适应不同的环境和工作负载，具有广泛的应用前景。未来，ADAPT可以进一步扩展到支持更复杂的伸缩策略和资源类型。

📄 摘要（原文）

Proactive autoscaling for containerized workloads depends on knowing the provisioning delay, i.e., the time between a scaling decision and the moment new capacity is ready to serve traffic. In practice, this cold-start duration can vary substantially across environments and even across consecutive scale-out events. We present ADAPT (Adaptive Duration Approximation for Predictive Timing), an online EWMA estimator that tracks coldstart duration at runtime. ADAPT feeds a dynamic planning horizon, FH-OPT, into a Model Predictive Controller (MPC) that optimizes replica counts over a rolling window. Together, these components form a closed-loop proactive autoscaling design that adapts its lookahead based on measured provisioning delay. Evaluated across three policies (MPC+LSTM, MPC+Prophet, HPA) and six workload archetypes with five random seeds, MPC+LSTM achieves below 5% SLA violation on all workloads, compared with 7-19% for reactive HPA and up to 28.7% for MPC+Prophet on bimodal traffic.

ADAPT: A Self-Calibrating Proactive Autoscaler for Container Orchestration

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理