The Influence of Text Variation on User Engagement in Cross-Platform Content Sharing
作者: Yibo Hu, Yiqiao Jin, Meng Ye, Ajay Divakaran, Srijan Kumar
分类: cs.SI, cs.AI, cs.IR
发布日期: 2025-04-26
💡 一句话要点
研究Reddit平台用户对YouTube视频标题改写的参与度影响,揭示文本特征与用户互动关系。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 跨平台内容分享 用户参与度 文本改写 受控实验 BERT模型
📋 核心要点
- 现有跨平台内容分享中,文本与视觉内容结合的用户参与度驱动因素复杂,缺乏深入理解。
- 通过构建大型数据集和设计受控实验,研究文本改写对Reddit用户参与度的影响,隔离混淆因素。
- 实验结果表明,有效的标题改写具有情感共鸣、词汇丰富性,并与社区规范对齐,BERT模型预测准确率达74%。
📝 摘要(中文)
本研究旨在理解跨平台社交媒体环境中,多模态内容(尤其是文本与视觉内容结合)的用户参与度驱动因素。具体而言,研究调查了将YouTube视频标题改编为Reddit帖子标题时,标题改写对用户参与度的影响。首先,构建并分析了一个大型Reddit帖子数据集,这些帖子分享了YouTube视频,结果表明21%的帖子标题仅经过了最小程度的修改。统计分析表明,标题改写能够显著提高用户参与度。其次,设计了一个受控的多阶段实验,通过消除视频受欢迎程度、发布时间以及社区规范等混淆因素,严格地隔离了文本变化的影响。全面的统计测试表明,有效的标题改写倾向于具有情感共鸣、词汇丰富性,并与社区特定规范保持一致。最后,使用微调的BERT分类器进行成对排序预测实验,准确率达到74%,显著优于包括GPT-4o在内的近乎随机的基线模型。这些结果验证了受控数据集有效地减少了混淆效应,使得高级模型能够学习并展示文本特征对用户参与度的影响。通过结合定量严谨性和定性见解,本研究揭示了参与度动态,并为未来的跨平台多模态内容策略提供了一个强大的框架。
🔬 方法详解
问题定义:论文旨在解决跨平台内容分享中,如何优化文本内容(特别是标题)以提高用户参与度的问题。现有方法缺乏对文本细微变化的量化分析,并且容易受到视频本身质量、发布时间等混淆因素的影响。
核心思路:论文的核心思路是通过构建大规模数据集和设计严格的受控实验,来隔离并量化文本改写对用户参与度的影响。通过控制视频内容、发布时间等因素,专注于研究标题文本的特征如何影响用户互动。
技术框架:整体框架包括以下几个阶段:1) 数据收集与分析:构建包含Reddit帖子和对应YouTube视频信息的大型数据集,分析标题改写的程度。2) 受控实验设计:设计多阶段实验,控制视频流行度、发布时间、社区规范等混淆因素,只改变标题文本。3) 统计分析:对实验数据进行统计分析,量化不同文本特征(如情感、词汇丰富度)对用户参与度的影响。4) 模型训练与预测:使用微调的BERT模型进行成对排序预测,判断哪个标题更可能获得更高的用户参与度。
关键创新:关键创新在于通过受控实验的设计,有效地减少了混淆因素,使得研究能够更准确地评估文本特征对用户参与度的影响。此外,使用微调的BERT模型进行成对排序预测,验证了模型能够学习并捕捉到文本特征与用户参与度之间的关系。
关键设计:在受控实验中,关键设计包括:1) 选择具有相似内容的YouTube视频,以消除内容差异的影响。2) 在相近的时间段内发布不同标题的Reddit帖子,以控制时间因素。3) 针对特定Reddit社区,分析其规范和偏好,确保标题改写符合社区文化。4) 使用BERT模型进行微调时,采用成对排序损失函数,优化模型对标题排序的预测能力。
🖼️ 关键图片
📊 实验亮点
实验结果表明,有效的标题改写能够显著提高用户参与度。微调的BERT模型在成对排序预测实验中达到了74%的准确率,显著优于包括GPT-4o在内的基线模型。这验证了受控数据集的有效性,并证明了高级模型能够学习并预测文本特征对用户参与度的影响。
🎯 应用场景
该研究成果可应用于跨平台内容营销、社交媒体运营、内容推荐系统等领域。通过优化内容标题,提升用户参与度,增加内容曝光,提高营销效果。未来可扩展到其他模态内容(如图像、音频)的优化,以及个性化内容推荐策略。
📄 摘要(原文)
In today's cross-platform social media landscape, understanding factors that drive engagement for multimodal content, especially text paired with visuals, remains complex. This study investigates how rewriting Reddit post titles adapted from YouTube video titles affects user engagement. First, we build and analyze a large dataset of Reddit posts sharing YouTube videos, revealing that 21% of post titles are minimally modified. Statistical analysis demonstrates that title rewrites measurably improve engagement. Second, we design a controlled, multi-phase experiment to rigorously isolate the effects of textual variations by neutralizing confounding factors like video popularity, timing, and community norms. Comprehensive statistical tests reveal that effective title rewrites tend to feature emotional resonance, lexical richness, and alignment with community-specific norms. Lastly, pairwise ranking prediction experiments using a fine-tuned BERT classifier achieves 74% accuracy, significantly outperforming near-random baselines, including GPT-4o. These results validate that our controlled dataset effectively minimizes confounding effects, allowing advanced models to both learn and demonstrate the impact of textual features on engagement. By bridging quantitative rigor with qualitative insights, this study uncovers engagement dynamics and offers a robust framework for future cross-platform, multimodal content strategies.