Zero Touch Predictive Orchestration: Automating Time-Series Models for the Cloud-Edge Continuum

📄 arXiv: 2606.09787v1 📥 PDF

作者: Abd Elghani Meliani, Arora Sagar, Adlen Ksentini, Raymond Knopp

分类: cs.LG, cs.NI

发布日期: 2026-06-08

备注: 19 pages, 14 figures


💡 一句话要点

提出自动化时间序列预测架构以解决云边缘计算的冷启动问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 云边缘计算 时间序列预测 自动化管理 数据混合 机器学习 资源调度

📋 核心要点

  1. 现有的时间序列预测方法在云边缘计算中面临冷启动问题,缺乏足够的历史数据来训练本地模型。
  2. 本文提出了一种自动化的时间序列预测架构,通过数据混合方法解决冷启动问题,提升预测准确性。
  3. 实验结果表明,结合TimeTrack数据集后,模型的均方误差、平均绝对误差和平均绝对百分比误差显著降低,收敛速度加快。

📝 摘要(中文)

云边缘连续体(CEC)通过将资源分配到远端边缘来支持延迟敏感的应用,但其极端波动性使得通过时间序列预测进行主动的零接触管理变得至关重要。现有的编排器面临严重的“冷启动”问题:新发现的节点缺乏训练本地预测模型所需的历史数据,而通用模型无法捕捉独特的硬件和微服务行为。为此,本文提出了一种完全自动化的时间序列预测架构,采用新颖的数据混合方法。在基础设施层面,介绍了一种轻量级、技术无关的资源暴露器(RE),能够动态发现节点并持续收集可定制的遥测数据。通过将初始本地样本与高分辨率的公共数据集TimeTrack合并,显著提高了预测准确性,并有效缓解了冷启动挑战。

🔬 方法详解

问题定义:本文旨在解决云边缘计算中的冷启动问题,现有方法在新节点缺乏历史数据时无法有效训练本地预测模型,导致预测性能低下。

核心思路:提出了一种自动化的时间序列预测架构,通过将新节点的遥测数据与高分辨率的公共数据集TimeTrack进行混合,来克服数据稀疏性问题,从而提高预测模型的准确性。

技术框架:整体架构包括资源暴露器(RE)模块,负责动态发现节点并收集遥测数据;数据混合模块,将本地数据与TimeTrack数据合并;以及神经架构搜索(NAS)引擎,自动生成高精度的基线模型。

关键创新:最重要的创新在于提出了一种数据混合方法,能够有效整合本地节点数据与高频公共数据集,显著提升预测模型的性能,与传统方法相比,能够更好地适应新环境。

关键设计:在模型训练中,采用了定制的损失函数以优化预测精度,并通过NAS引擎自动选择最优的网络结构,确保模型在不同硬件和微服务环境下的适应性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,结合TimeTrack数据集后,模型的均方误差(MSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)均显著降低,收敛速度较仅使用本地稀疏样本或通用数据集时加快,证明了数据混合方法的有效性。

🎯 应用场景

该研究的潜在应用领域包括智能城市、物联网设备管理和边缘计算平台等,能够为延迟敏感的应用提供更高效的资源管理方案。通过自动化的时间序列预测,能够降低运维成本,提高系统的响应速度和可靠性,具有重要的实际价值和未来影响。

📄 摘要(原文)

The Cloud-Edge Continuum (CEC) enables latency-critical applications by distributing resources to the far edge, but its extreme volatility makes proactive Zero Touch Management via time-series forecasting essential. However, orchestrators face a severe "cold start" problem: newly discovered nodes lack the historical data required to train localized predictive models, while generalized models fail to capture unique hardware and microservice behaviors. To solve this, we propose a fully automated time-series prediction architecture driven by a novel data-mixing methodology. At the infrastructure level, we introduce a lightweight, technology-agnostic Resource Exposer (RE) that dynamically discovers nodes and continuously collects customizable telemetry (e.g., compute, network, energy). To overcome the sparsity of these initial local samples, our framework automatically merges them with TimeTrack, our publicly available, high-resolution dataset collected at 45-second intervals. This synergizes TimeTrack's foundational, high-frequency temporal patterns with the precise calibration of the local node data. Processed through a Neural Architecture Search (NAS) engine, the system automatically generates highly accurate baseline models. Experimental results demonstrate that merging the target data with TimeTrack effectively mitigates the cold start challenge. This integration significantly improves forecasting accuracy measured in Mean Squared Error (MSE), Mean Absolute Error (MAE), and Mean Absolute Percentage Error (MAPE) and accelerates convergence compared to training on the sparse local samples alone, training solely on generic datasets, or mixing the target data with standard alternative datasets, establishing a robust foundation for continuous MLOps deployment.