Comparative Study on the Discourse Meaning of Chinese and English Media in the Paris Olympics Based on LDA Topic Modeling Technology and LLM Prompt Engineering
作者: Yinglong Yu, Zhaopu Yao, Fang Yuan
分类: cs.CL
发布日期: 2025-04-25
💡 一句话要点
基于LDA主题建模和LLM提示工程比较中英媒体对巴黎奥运会的叙事意义
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: LDA主题建模 LLM提示工程 跨文化传播 媒体内容分析 语义韵律 奥运报道 叙事分析
📋 核心要点
- 现有研究缺乏对中英媒体奥运报道叙事差异的深入分析,难以揭示文化背景对媒体报道的影响。
- 该研究结合LDA主题建模和LLM提示工程,从主题、语义韵律等多维度对比中英媒体的叙事差异。
- 研究结果揭示了中英媒体在奥运报道中关注点和情感倾向的差异,为跨文化传播研究提供参考。
📝 摘要(中文)
本研究利用主题建模、大型语言模型(LLM)提示工程和语料库短语学方法,分析中英文媒体关于巴黎奥运会的报道,旨在探索叙事构建和态度意义的异同。共同主题包括开幕式、运动员表现和赞助品牌。中文媒体侧重于特定运动、体育精神、兴奋剂争议和新技术,而英文媒体则侧重于女性运动员、奖牌获得和资格争议。中文报道在描述开幕式和体育精神时,更多地表现出介词的共现和积极的语义韵律。英文报道在报道女性运动员时表现出积极的语义韵律,但在预测开幕式反应和讨论女子拳击争议时则表现出消极的语义韵律。
🔬 方法详解
问题定义:本研究旨在分析中英文媒体在报道巴黎奥运会时,在叙事构建和态度意义上的异同。现有方法通常依赖于人工分析,效率低且主观性强,难以捕捉大规模语料中的细微差异。因此,需要一种能够自动提取主题、分析语义韵律的方法,以客观地比较中英媒体的报道差异。
核心思路:本研究的核心思路是结合LDA主题建模和LLM提示工程,从主题分布和语义韵律两个方面分析中英文媒体的报道。LDA主题建模用于提取报道中的主要话题,LLM提示工程用于分析报道中的情感倾向和语义韵律。通过对比不同媒体在这些方面的表现,可以揭示其叙事构建和态度意义的差异。
技术框架:本研究的技术框架主要包括以下几个步骤:1) 数据收集:收集关于巴黎奥运会的中英文媒体报道;2) 文本预处理:对文本进行分词、去除停用词等处理;3) LDA主题建模:使用LDA算法提取报道中的主题;4) LLM提示工程:利用LLM分析报道中的情感倾向和语义韵律;5) 结果分析:对比中英文媒体在主题分布和语义韵律上的差异。
关键创新:本研究的关键创新在于结合了LDA主题建模和LLM提示工程,能够从主题和语义韵律两个维度全面分析媒体报道的叙事差异。与传统的人工分析方法相比,该方法具有更高的效率和客观性。此外,利用LLM进行语义韵律分析,能够更准确地捕捉报道中的情感倾向。
关键设计:在LDA主题建模中,需要确定主题的数量,这可以通过困惑度等指标进行优化。在LLM提示工程中,需要设计合适的提示语,以引导LLM分析报道中的情感倾向和语义韵律。此外,还需要选择合适的LLM模型,并对其进行微调,以提高分析的准确性。
🖼️ 关键图片
📊 实验亮点
研究结果表明,中英文媒体在巴黎奥运会的报道中存在显著差异。中文媒体更关注体育精神和兴奋剂争议,而英文媒体更关注女性运动员和资格争议。中文报道在描述开幕式和体育精神时表现出更积极的语义韵律,而英文报道在预测开幕式反应和讨论女子拳击争议时则表现出消极的语义韵律。这些发现揭示了不同文化背景下媒体报道的差异。
🎯 应用场景
该研究成果可应用于跨文化传播、舆情分析、媒体内容分析等领域。通过了解不同文化背景下媒体报道的差异,可以更好地进行跨文化交流和传播。此外,该方法还可以用于分析媒体对特定事件的报道,了解其立场和态度,为舆情分析提供参考。该研究还有助于提升媒体内容分析的自动化水平。
📄 摘要(原文)
This study analyzes Chinese and English media reports on the Paris Olympics using topic modeling, Large Language Model (LLM) prompt engineering, and corpus phraseology methods to explore similarities and differences in discourse construction and attitudinal meanings. Common topics include the opening ceremony, athlete performance, and sponsorship brands. Chinese media focus on specific sports, sports spirit, doping controversies, and new technologies, while English media focus on female athletes, medal wins, and eligibility controversies. Chinese reports show more frequent prepositional co-occurrences and positive semantic prosody in describing the opening ceremony and sports spirit. English reports exhibit positive semantic prosody when covering female athletes but negative prosody in predicting opening ceremony reactions and discussing women's boxing controversies.