A longitudinal sentiment analysis of Sinophobia during COVID-19 using large language models
作者: Chen Wang, Rohitash Chandra
分类: cs.CL, cs.AI
发布日期: 2024-08-29
💡 一句话要点
利用大型语言模型纵向分析COVID-19期间的仇华情绪
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 情感分析 大型语言模型 仇华情绪 COVID-19 纵向研究
📋 核心要点
- COVID-19期间仇外情绪高涨,尤其针对华裔的歧视现象严重,现有方法难以有效追踪和分析这种情绪的演变。
- 利用大型语言模型分析社交媒体文本,能够捕捉细微的情绪变化,从而纵向评估仇华情绪的演变趋势。
- 研究表明仇华情绪与疫情发展和政治叙事密切相关,负面情绪占据主导,缺乏同情,强调透明沟通的重要性。
📝 摘要(中文)
COVID-19大流行加剧了仇外情绪,特别是仇华情绪,导致对华裔人士的广泛歧视。大型语言模型(LLM)是用于自然语言处理(NLP)任务的预训练深度学习模型。LLM理解和生成类人文本的能力使其特别适用于分析社交媒体数据,以检测和评估情绪。本文提出了一个利用LLM的情绪分析框架,用于纵向分析COVID-19大流行期间X(Twitter)上表达的仇华情绪。结果表明,仇华推文的峰值、仇华情绪与COVID-19病例的激增之间存在显著相关性,揭示了大流行的演变影响了公众情绪和仇华言论的流行。此外,情绪分析揭示了以恼怒和否认为主的负面情绪,这突显了政治叙事和错误信息对塑造公众舆论的影响。研究结果中缺乏先前COVID-19相关研究中存在同情情绪,突显了媒体中政治叙事看待疫情的方式以及对中国社区的指责。本研究强调了在应对全球危机期间,透明沟通对于减轻仇外情绪的重要性。
🔬 方法详解
问题定义:本研究旨在解决COVID-19疫情期间社交媒体上仇华情绪的纵向分析问题。现有方法在处理大规模社交媒体数据、捕捉细微情绪变化以及关联疫情发展和政治叙事方面存在不足,难以全面了解仇华情绪的演变。
核心思路:本研究的核心思路是利用大型语言模型(LLM)强大的自然语言处理能力,对社交媒体文本进行情感分析,从而追踪和评估仇华情绪的演变。通过分析大量推文,可以识别仇华情绪的峰值、主要情感类型以及与疫情发展和政治叙事的关联。
技术框架:该研究的技术框架主要包括以下几个阶段:1) 数据收集:收集COVID-19疫情期间X(Twitter)上的相关推文;2) 数据预处理:对推文进行清洗、去噪等处理;3) 情感分析:使用预训练的LLM对推文进行情感分析,识别仇华情绪;4) 纵向分析:分析仇华情绪随时间的变化趋势,并与疫情发展和政治叙事进行关联;5) 结果可视化:将分析结果以图表等形式进行可视化展示。
关键创新:本研究的关键创新在于利用大型语言模型进行仇华情绪的纵向分析,能够更准确地捕捉细微的情绪变化,并关联疫情发展和政治叙事。此外,该研究还关注了先前研究中缺乏的同情情绪,从而更全面地了解公众对疫情的反应。
关键设计:研究中使用了预训练的LLM进行情感分析,具体模型选择未知。关键设计可能包括:1) 情感分类的类别定义(例如,正面、负面、中性、恼怒、否认、同情等);2) 模型微调策略(如果进行了微调);3) 情感强度评估方法;4) 时间窗口的选择和分析方法(用于纵向分析)。
🖼️ 关键图片
📊 实验亮点
研究结果表明,仇华推文的峰值、仇华情绪与COVID-19病例的激增之间存在显著相关性。情感分析显示,负面情绪(如恼怒和否认)占据主导,缺乏同情。这些发现突显了政治叙事和错误信息对公众舆论的影响,以及透明沟通在应对全球危机中的重要性。
🎯 应用场景
该研究成果可应用于公共卫生领域,帮助政府和相关机构了解公众对疫情的反应,及时采取措施缓解负面情绪,促进社会和谐。此外,该研究方法也可推广到其他社会议题的情绪分析,例如种族歧视、性别歧视等,为社会科学研究提供新的视角。
📄 摘要(原文)
The COVID-19 pandemic has exacerbated xenophobia, particularly Sinophobia, leading to widespread discrimination against individuals of Chinese descent. Large language models (LLMs) are pre-trained deep learning models used for natural language processing (NLP) tasks. The ability of LLMs to understand and generate human-like text makes them particularly useful for analysing social media data to detect and evaluate sentiments. We present a sentiment analysis framework utilising LLMs for longitudinal sentiment analysis of the Sinophobic sentiments expressed in X (Twitter) during the COVID-19 pandemic. The results show a significant correlation between the spikes in Sinophobic tweets, Sinophobic sentiments and surges in COVID-19 cases, revealing that the evolution of the pandemic influenced public sentiment and the prevalence of Sinophobic discourse. Furthermore, the sentiment analysis revealed a predominant presence of negative sentiments, such as annoyance and denial, which underscores the impact of political narratives and misinformation shaping public opinion. The lack of empathetic sentiment which was present in previous studies related to COVID-19 highlights the way the political narratives in media viewed the pandemic and how it blamed the Chinese community. Our study highlights the importance of transparent communication in mitigating xenophobic sentiments during global crises.