SemaTune: Semantic-Aware Online OS Tuning with Large Language Models

📄 arXiv: 2605.15026v1 📥 PDF

作者: Georgios Liargkovas, Mihir Nitin Joshi, Hubertus Franke, Kostis Kaffes

分类: cs.OS, cs.AI, cs.PF

发布日期: 2026-05-14

备注: 17 pages, 12 figures


💡 一句话要点

SemaTune:基于大语言模型的语义感知在线操作系统调优框架

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 操作系统调优 在线调优 大语言模型 语义感知 性能优化

📋 核心要点

  1. 现有在线操作系统调优方法将系统参数视为黑盒,忽略了参数间的关联和语义信息,导致优化效果不佳。
  2. SemaTune利用大语言模型理解操作系统参数的语义,结合历史数据和实时遥测信息,指导参数搜索和优化过程。
  3. 实验结果表明,SemaTune在多个基准测试中显著提升了系统性能,优于传统方法,且成本可控。

📝 摘要(中文)

在线操作系统调优可以改善长时间运行的服务的性能,但现有的控制器与实际运行的主机匹配度不高。它们将调度器、电源、内存和I/O控制视为黑盒变量,并优化一个标量奖励。这种观点忽略了跨旋钮策略结构,在应用程序指标不可用时失效,并且可能将运行中的服务发送到不良区域,即使在删除错误设置后仍然存在。我们提出了SemaTune,一个具有有界语言模型指导的主机端稳态操作系统调优框架。SemaTune将旋钮模式、遥测数据、当前配置、最近的动作-响应历史以及检索到的先前运行信息转换为紧凑的决策上下文。一个快速循环提出低延迟更新,一个较慢的循环定期修改搜索策略,并且每个提出的更改在到达内核或sysctl接口之前都通过类型验证。这使得控制器能够推理操作系统控制的含义和间接性能信号,同时保持模型成本、延迟和权限受到约束。我们在来自五个基准测试套件的13个实时工作负载上评估了SemaTune,同时调整了多达41个Linux参数。在整个套件中,SemaTune比默认设置提高了72.5%的稳定阶段性能,相对于最强的非LLM基线提高了153.3%。一个30窗口会话的模型调用成本约为0.20美元。仅使用主机级指标,SemaTune仍然优于给定直接应用程序目标的基线93.7个百分点,同时避免了结构盲探索所达到的严重降级区域。

🔬 方法详解

问题定义:现有在线操作系统调优方法主要存在以下痛点:一是将操作系统参数视为独立的黑盒变量,忽略了参数之间的依赖关系和策略结构;二是当应用程序指标不可用时,优化效果会显著下降;三是容易陷入性能降级的区域,且难以恢复。这些问题导致现有方法在实际应用中效果不佳。

核心思路:SemaTune的核心思路是利用大语言模型(LLM)来理解操作系统参数的语义信息,并结合历史运行数据和实时遥测数据,指导在线调优过程。通过将参数模式、遥测数据、配置信息等转化为LLM可以理解的上下文,使控制器能够推理参数的含义和间接性能信号,从而更有效地进行优化。

技术框架:SemaTune的整体框架包含以下几个主要模块:1) 决策上下文构建:将旋钮模式、遥测数据、当前配置、历史数据等信息整合为LLM的输入上下文。2) 快速更新循环:以低延迟的方式提出参数更新建议。3) 慢速策略修订循环:定期修订搜索策略,以适应不断变化的工作负载。4) 类型验证:在参数更新生效前,进行类型验证,确保参数值的合法性。

关键创新:SemaTune的关键创新在于将大语言模型引入到在线操作系统调优中,利用LLM的语义理解能力来指导参数搜索和优化。这与传统方法将参数视为黑盒变量的做法有本质区别。通过语义感知,SemaTune能够更好地理解参数之间的关系,避免陷入性能降级的区域,并更有效地利用历史数据。

关键设计:SemaTune的关键设计包括:1) 如何将操作系统参数和遥测数据转化为LLM可以理解的上下文;2) 如何设计快速更新循环和慢速策略修订循环,以平衡优化速度和效果;3) 如何进行类型验证,确保参数更新的安全性;4) 如何控制LLM的调用成本和延迟,使其适用于在线调优场景。论文中并未详细描述具体的参数设置、损失函数或网络结构,这些可能是LLM本身的设计细节或未公开的实现细节。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

SemaTune在13个来自五个基准测试套件的实时工作负载上进行了评估,最多调整了41个Linux参数。实验结果表明,SemaTune比默认设置提高了72.5%的稳定阶段性能,相对于最强的非LLM基线提高了153.3%。即使仅使用主机级指标,SemaTune仍然优于给定直接应用程序目标的基线93.7个百分点,并且避免了结构盲探索可能导致的严重性能降级。

🎯 应用场景

SemaTune可应用于各种需要长时间运行的在线服务,例如数据库、Web服务器、缓存系统等。通过自动调整操作系统参数,SemaTune可以显著提升这些服务的性能和资源利用率,降低运维成本。未来,SemaTune有望成为一种通用的在线操作系统调优工具,广泛应用于云计算、边缘计算等领域。

📄 摘要(原文)

Online OS tuning can improve long-running services, but existing controllers are poorly matched to live hosts. They treat scheduler, power, memory, and I/O controls as black-box variables and optimize a scalar reward. This view ignores cross-knob policy structure, breaks down when application metrics are unavailable, and can send a running service into degraded regions that persist after the bad setting is removed. We present SemaTune, a host-side framework for steady-state OS tuning with bounded language-model guidance. SemaTune turns knob schemas, telemetry, current configuration, recent action--response history, and retrieved prior runs into a compact decision context. A fast loop proposes low-latency updates, a slower loop periodically revises the search strategy, and every proposed change passes through typed validation before reaching kernel or sysctl interfaces. This lets the controller reason about OS-control meaning and indirect performance signals while keeping model cost, latency, and authority constrained. We evaluate SemaTune on 13 live workloads from five benchmark suites while tuning up to 41 Linux parameters. Across the suite, SemaTune improves stable-phase performance by 72.5\% over default settings and by 153.3\% relative to the strongest non-LLM baseline. A 30-window session costs about \$0.20 in model calls. With only host-level metrics, SemaTune still outperforms baselines given direct application objectives by 93.7 percentage points, while avoiding severe degraded regions reached by structure-blind exploration.