QoS-QoE Translation with Large Language Model

作者: Yingjie Yu, Mingyuan Wu, Ahmadreza Eslaminia, Lingzhi Zhao, Kaizhuo Yan, Klara Nahrstedt

分类: cs.MM, cs.DB, cs.LG

发布日期: 2026-04-09

🔗 代码/项目: PROJECT_PAGE

💡 一句话要点

构建QoS-QoE翻译数据集，并利用大语言模型实现双向翻译，提升多媒体质量预测与优化。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: QoS-QoE翻译 大语言模型 多媒体质量预测 数据集构建 视频流媒体

📋 核心要点

现有QoS-QoE研究分散且针对特定场景，缺乏系统性重用和泛化能力，阻碍大规模分析。
构建QoS-QoE翻译数据集，包含结构化关系、参数定义、证据和元数据，为LLM训练提供基础。
实验表明，经过微调的LLM在QoS-QoE双向翻译中表现出色，可用于质量预测和优化。

📝 摘要（中文）

QoS-QoE翻译是多媒体系统中的一个基本问题，因为它描述了可测量的系统和网络条件如何影响用户感知体验。尽管之前的许多研究已经检验了这种关系，但他们的发现通常是为特定设置而开发的，并且仍然分散在论文、实验设置和报告格式中，限制了系统的重用、跨场景泛化和大规模分析。为了解决这个差距，我们首先介绍了QoS-QoE翻译数据集，这是一个源于多媒体文献的结构化QoS-QoE关系数据集，重点是视频流相关的任务。我们通过一个自动化的流程来构建数据集，该流程结合了论文管理、QoS-QoE关系提取和迭代数据评估。每个记录都保留了提取的关系以及参数定义、支持证据和上下文元数据。我们进一步评估了大语言模型（LLM）在QoS-QoE翻译方面的能力，包括在我们数据集上进行监督微调之前和之后，并展示了在双向翻译（从QoS到QoE和从QoE到QoS）中连续值和离散标签预测方面的强大性能。我们的数据集为基准测试LLM在QoS-QoE翻译中的应用，以及支持未来基于LLM的多媒体质量预测和优化提供了基础。完整的数据集和代码可在https://yyu6969.github.io/qos-qoe-translation-page/公开获取，以实现完全的可重复性和开放访问。

🔬 方法详解

问题定义：论文旨在解决多媒体领域中QoS（服务质量）与QoE（用户体验质量）之间关系难以系统化利用的问题。现有研究结果分散在不同的论文和实验设置中，缺乏统一的数据集和标准化的评估方法，导致难以进行跨场景的泛化和大规模分析。这阻碍了多媒体系统性能优化和用户体验提升。

核心思路：论文的核心思路是构建一个大规模、结构化的QoS-QoE翻译数据集，并利用大语言模型（LLM）学习QoS和QoE之间的映射关系。通过在数据集上对LLM进行微调，使其能够准确地进行QoS到QoE以及QoE到QoS的双向翻译，从而为多媒体质量预测和优化提供新的工具。

技术框架：整体框架包含三个主要阶段：1) 论文管理：自动收集和筛选多媒体领域的论文；2) QoS-QoE关系提取：从论文中提取结构化的QoS-QoE关系，包括参数定义、支持证据和上下文元数据；3) 数据评估：对提取的数据进行迭代评估和清洗，确保数据质量。提取的数据用于训练和评估LLM。

关键创新：论文的关键创新在于构建了一个大规模、源于文献的QoS-QoE翻译数据集。该数据集不仅包含了结构化的QoS-QoE关系，还提供了参数定义、支持证据和上下文元数据，为LLM的学习提供了丰富的上下文信息。此外，论文还验证了LLM在QoS-QoE翻译任务中的有效性，为未来的研究提供了新的方向。

关键设计：数据集构建过程中，使用了自动化的流程来提取QoS-QoE关系，并进行了人工评估和清洗，以保证数据质量。在LLM的训练过程中，使用了监督微调的方法，并针对连续值和离散标签预测任务设计了相应的损失函数。具体LLM结构和超参数设置未知。

🖼️ 关键图片

📊 实验亮点

实验结果表明，经过在QoS-QoE翻译数据集上微调的LLM，在QoS到QoE以及QoE到QoS的双向翻译任务中均取得了显著的性能提升。具体性能数据未知，但论文强调了LLM在连续值和离散标签预测方面的强大能力。该数据集为后续研究提供了一个可靠的基准。

🎯 应用场景

该研究成果可应用于视频流媒体、在线游戏、VR/AR等多种多媒体应用场景。通过准确预测用户体验质量，可以动态调整系统参数，优化网络资源分配，提升用户满意度。未来，该研究可进一步扩展到其他QoS-QoE相关的领域，例如语音通信、图像处理等。

📄 摘要（原文）

QoS-QoE translation is a fundamental problem in multimedia systems because it characterizes how measurable system and network conditions affect user-perceived experience. Although many prior studies have examined this relationship, their findings are often developed for specific setups and remain scattered across papers, experimental settings, and reporting formats, limiting systematic reuse, cross-scenario generalization, and large-scale analysis. To address this gap, we first introduce QoS-QoE Translation dataset, a source-grounded dataset of structured QoS-QoE relationships from the multimedia literature, with a focus on video streaming related tasks. We construct the dataset through an automated pipeline that combines paper curation, QoS-QoE relationship extraction, and iterative data evaluation. Each record preserves the extracted relationship together with parameter definitions, supporting evidence, and contextual metadata. We further evaluate the capability of large language models (LLMs) on QoS-QoE translation, both before and after supervised fine-tuning on our dataset, and show strong performance on both continuous-value and discrete-label prediction in bidirectional translation, from QoS-QoE and QoE-QoS. Our dataset provides a foundation for benchmarking LLMs in QoS-QoE translation and for supporting future LLM-based reasoning for multimedia quality prediction and optimization. The complete dataset and code are publicly available at https://yyu6969.github.io/qos-qoe-translation-page/, for full reproducibility and open access.

QoS-QoE Translation with Large Language Model

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理