SLA-Centric Automated Algorithm Selection Framework for Cloud Environments

📄 arXiv: 2507.21963v1 📥 PDF

作者: Siana Rizwan, Tasnim Ahmed, Salimur Choudhury

分类: cs.LG

发布日期: 2025-07-29


💡 一句话要点

提出面向云环境SLA的自动化算法选择框架,优化组合问题。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 自动化算法选择 服务级别协议 云环境 组合优化 机器学习 0-1背包问题 性能预测

📋 核心要点

  1. 云环境下的服务级别协议(SLA)违规会影响效率和云服务提供商的盈利能力,因此需要更智能的资源管理。
  2. 论文提出一种SLA感知的自动化算法选择框架,通过机器学习预测算法性能,并根据SLA约束选择最优的算法-硬件组合。
  3. 实验结果表明,该框架在0-1背包问题上有效,并通过消融研究验证了关键组件和超参数的影响。

📝 摘要(中文)

本文提出了一种面向云环境的服务级别协议(SLA)感知的自动化算法选择框架,用于解决资源受限环境下的组合优化问题。该框架利用机器学习模型集成来预测算法在不同硬件上的性能,并根据SLA约束对算法-硬件对进行排序。该框架应用于0-1背包问题。作者构建了一个包含实例特定特征以及内存使用、运行时间和最优性差距的数据集,涵盖6种算法。通过分类和回归任务对框架进行了实证评估,并通过消融研究探索了超参数、学习方法和大型语言模型在回归中的有效性,以及基于SHAP的可解释性。

🔬 方法详解

问题定义:论文旨在解决在资源受限的云环境中,如何根据服务级别协议(SLA)自动选择最优算法来解决组合优化问题。现有方法通常依赖于手动选择或简单的启发式规则,无法充分利用云环境的动态性和异构性,容易导致SLA违规和资源浪费。

核心思路:论文的核心思路是利用机器学习模型来预测不同算法在不同硬件配置下的性能表现,并结合SLA约束,选择满足约束条件且性能最优的算法-硬件组合。通过预测模型,可以避免盲目搜索和试错,提高算法选择的效率和准确性。

技术框架:该框架主要包含以下几个模块:1) 特征提取:从组合优化问题的实例中提取相关特征,例如问题规模、约束条件等。2) 算法性能预测:使用机器学习模型(如回归模型)预测不同算法在不同硬件上的运行时间、内存使用和最优性差距等性能指标。3) SLA约束建模:将SLA约束转化为数学表达式,例如最大运行时间、最小优化目标等。4) 算法选择:根据预测的性能指标和SLA约束,对算法-硬件对进行排序,选择满足约束条件且性能最优的组合。

关键创新:该论文的关键创新在于提出了一个SLA感知的自动化算法选择框架,该框架能够根据云环境的动态性和SLA约束,自动选择最优的算法-硬件组合。与传统方法相比,该框架能够显著提高算法选择的效率和准确性,降低SLA违规的风险。

关键设计:论文使用机器学习模型进行算法性能预测,并采用集成学习的方法提高预测的准确性。此外,论文还使用了SHAP值来解释模型的预测结果,从而提高模型的可解释性和可信度。针对0-1背包问题,论文构建了一个包含实例特定特征以及内存使用、运行时间和最优性差距的数据集,涵盖6种算法。具体使用的机器学习模型和超参数的选择通过实验进行优化。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过实验验证了该框架在0-1背包问题上的有效性。实验结果表明,该框架能够根据SLA约束,自动选择最优的算法-硬件组合,并显著提高求解效率。消融研究表明,超参数、学习方法和大型语言模型在回归任务中具有重要影响。此外,基于SHAP的可解释性分析有助于理解模型的预测行为。

🎯 应用场景

该研究成果可应用于各种云环境下的组合优化问题,例如资源调度、任务分配、网络优化等。通过自动化算法选择,可以提高云服务的效率和可靠性,降低SLA违规的风险,并为云服务提供商带来更高的经济效益。未来,该框架可以扩展到更多类型的优化问题和云环境,并与其他云管理工具集成,实现更智能的云资源管理。

📄 摘要(原文)

Cloud computing offers on-demand resource access, regulated by Service-Level Agreements (SLAs) between consumers and Cloud Service Providers (CSPs). SLA violations can impact efficiency and CSP profitability. In this work, we propose an SLA-aware automated algorithm-selection framework for combinatorial optimization problems in resource-constrained cloud environments. The framework uses an ensemble of machine learning models to predict performance and rank algorithm-hardware pairs based on SLA constraints. We also apply our framework to the 0-1 knapsack problem. We curate a dataset comprising instance specific features along with memory usage, runtime, and optimality gap for 6 algorithms. As an empirical benchmark, we evaluate the framework on both classification and regression tasks. Our ablation study explores the impact of hyperparameters, learning approaches, and large language models effectiveness in regression, and SHAP-based interpretability.