DeLoad: Demand-Driven Short-Video Preloading with Scalable Watch-Time Estimation

📄 arXiv: 2510.18459v1 📥 PDF

作者: Tong Liu, Zhiwei Fan, Guanyan Peng, Haodan Zhang, Yucheng Zhang, Zhen Wang, Pengjin Xie, Liang Liu

分类: cs.MM, cs.AI, eess.IV

发布日期: 2025-10-21


💡 一句话要点

DeLoad:通过可扩展观看时长估计实现需求驱动的短视频预加载

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 短视频预加载 QoE优化 带宽效率 观看时长预测 深度强化学习

📋 核心要点

  1. 现有短视频预加载策略难以适应动态网络条件,导致QoE受损。
  2. DeLoad通过动态调整下载任务大小和多维观看时长估计,优化预加载。
  3. 实验表明,DeLoad显著提升QoE指标,并降低带宽消耗。

📝 摘要(中文)

短视频流媒体已成为数字媒体的主流模式,其特点是快速滑动交互和多样化的媒体内容。一个关键的技术挑战是设计一种有效的预加载策略,该策略可以动态地从不断变化的播放列表中选择下载任务并确定其优先级,从而在实际商业约束下平衡体验质量(QoE)和带宽效率。然而,现实世界的分析揭示了现有方法的关键局限性:(1)下载任务大小对动态条件的适应性不足,以及(2)观看时长预测模型难以大规模可靠地部署。在本文中,我们提出了一种新颖的预加载框架DeLoad,通过引入动态任务大小调整和一种实用的多维观看时长估计方法来解决这些问题。此外,还训练了一个深度强化学习(DRL)增强代理,以自适应地优化下载范围决策。在离线测试平台上进行的大量评估,利用了大规模的真实网络数据,表明DeLoad在QoE指标方面取得了显著改善(增益34.4%至87.4%)。此外,在大型商业短视频平台上部署后,DeLoad使整体用户观看时长增加了0.09%,同时减少了缓冲事件和3.76%的带宽消耗。

🔬 方法详解

问题定义:现有短视频预加载策略在动态网络条件下表现不佳,主要体现在两个方面:一是下载任务大小无法根据网络状况灵活调整,导致带宽浪费或缓冲;二是观看时长预测模型难以大规模部署,影响预加载的准确性。现有方法难以在QoE和带宽效率之间取得平衡。

核心思路:DeLoad的核心思路是根据用户需求动态调整下载任务的大小,并利用多维信息进行更准确的观看时长预测。通过这种方式,DeLoad能够更有效地利用带宽资源,减少缓冲,并提高用户的观看体验。

技术框架:DeLoad框架主要包含以下几个模块:1) 动态任务大小调整模块:根据当前网络状况和用户行为,动态调整每个下载任务的大小;2) 多维观看时长估计模块:利用多种特征(如视频内容、用户历史行为等)进行观看时长预测;3) 深度强化学习(DRL)增强代理:用于优化下载范围决策,自适应地调整预加载策略。

关键创新:DeLoad的关键创新在于动态任务大小调整和多维观看时长估计。动态任务大小调整能够更好地适应动态网络条件,而多维观看时长估计能够提高预测的准确性。此外,DRL增强代理的引入使得预加载策略能够自适应地优化。

关键设计:在动态任务大小调整方面,DeLoad可能采用了基于网络带宽和用户缓冲情况的自适应算法。在多维观看时长估计方面,DeLoad可能使用了深度学习模型,并结合了多种特征,如视频内容特征、用户行为特征、社交关系特征等。DRL增强代理可能使用了Actor-Critic架构,并设计了合适的奖励函数来优化预加载策略。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

DeLoad在离线测试平台上进行了大量评估,结果表明,DeLoad在QoE指标方面取得了显著改善,增益范围为34.4%至87.4%。在大型商业短视频平台上部署后,DeLoad使整体用户观看时长增加了0.09%,同时减少了缓冲事件和3.76%的带宽消耗。这些结果表明,DeLoad在实际应用中具有显著的优势。

🎯 应用场景

DeLoad可应用于各种短视频平台,提升用户观看体验,降低带宽成本。该研究成果也可推广到其他流媒体应用,如直播、在线教育等,具有广泛的应用前景和商业价值。未来,可以进一步研究如何将DeLoad与其他优化技术相结合,以实现更高效的流媒体传输。

📄 摘要(原文)

Short video streaming has become a dominant paradigm in digital media, characterized by rapid swiping interactions and diverse media content. A key technical challenge is designing an effective preloading strategy that dynamically selects and prioritizes download tasks from an evolving playlist, balancing Quality of Experience (QoE) and bandwidth efficiency under practical commercial constraints. However, real world analysis reveals critical limitations of existing approaches: (1) insufficient adaptation of download task sizes to dynamic conditions, and (2) watch time prediction models that are difficult to deploy reliably at scale. In this paper, we propose DeLoad, a novel preloading framework that addresses these issues by introducing dynamic task sizing and a practical, multi dimensional watch time estimation method. Additionally, a Deep Reinforcement Learning (DRL) enhanced agent is trained to optimize the download range decisions adaptively. Extensive evaluations conducted on an offline testing platform, leveraging massive real world network data, demonstrate that DeLoad achieves significant improvements in QoE metrics (34.4% to 87.4% gain). Furthermore, after deployment on a large scale commercial short video platform, DeLoad has increased overall user watch time by 0.09% while simultaneously reducing rebuffering events and 3.76% bandwidth consumption.