When People are Floods: Analyzing Dehumanizing Metaphors in Immigration Discourse with Large Language Models

📄 arXiv: 2502.13246v2 📥 PDF

作者: Julia Mendelsohn, Ceren Budak

分类: cs.CL, cs.CY

发布日期: 2025-02-18 (更新: 2025-07-18)

备注: To appear at ACL 2025. Please cite ACL version when proceedings are available

期刊: Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (2025) 8079-8103

DOI: 10.18653/v1/2025.acl-long.398


💡 一句话要点

提出一种结合词级和文档级信号的新方法,利用大型语言模型分析移民讨论中的隐喻

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 隐喻分析 大型语言模型 政治传播 移民讨论 社交媒体分析

📋 核心要点

  1. 现有方法难以有效捕捉政治讨论中微妙和隐含的隐喻语言,尤其是在移民等敏感话题中。
  2. 论文提出一种新颖的计算方法,结合词级和文档级信号,利用大型语言模型来衡量隐喻的使用情况。
  3. 通过分析40万条关于移民的推文,揭示了隐喻使用与政治意识形态和用户参与度之间的关系,并发现生物相关隐喻与更多转发相关。

📝 摘要(中文)

隐喻是一种用一个概念来讨论另一个概念的修辞手法,在政治领域被广泛使用,并能影响人们对重要问题的理解。本文开发了一种计算方法来衡量隐喻语言,重点关注社交媒体上关于移民的讨论。基于定性的社会科学研究,我们确定了移民讨论中出现的七个概念(例如,“水”或“害虫”)。我们提出并评估了一种新颖的技术,该技术利用词级和文档级信号来衡量与这些概念相关的隐喻。然后,我们研究了在美国关于移民的40万条推文中,隐喻、政治意识形态和用户参与度之间的关系。研究发现,保守派往往比自由派更多地使用非人化隐喻,但这种影响因概念而异。此外,与生物相关的隐喻与更多的转发相关,尤其是对于自由派作者。我们的工作强调了计算方法在理解政治讨论中微妙和隐含语言方面的潜力,可以补充定性方法。

🔬 方法详解

问题定义:论文旨在解决如何有效识别和量化社交媒体上关于移民讨论中使用的隐喻,特别是那些具有非人化色彩的隐喻。现有方法通常依赖于人工标注或简单的关键词匹配,难以捕捉隐喻的细微之处和上下文依赖性,并且缺乏对大规模数据的处理能力。

核心思路:论文的核心思路是结合词级和文档级的信息,利用大型语言模型(LLM)的强大语义理解能力,来更准确地识别和衡量隐喻的使用。通过将隐喻与特定的概念(如“水”、“害虫”)联系起来,并分析推文中词语和整体语境与这些概念的关联程度,从而判断隐喻的存在和强度。

技术框架:整体框架包括以下几个主要阶段:1) 概念识别:基于社会科学研究,确定移民讨论中常见的七个概念。2) 数据收集:收集包含移民相关关键词的推文数据。3) 隐喻测量:利用LLM计算词级和文档级信号,衡量推文与特定概念的关联程度。4) 统计分析:分析隐喻使用与政治意识形态、用户参与度等因素之间的关系。

关键创新:最重要的技术创新点在于结合了词级和文档级信号来测量隐喻。传统的隐喻识别方法往往只关注单个词语的含义,而忽略了上下文信息。该方法通过同时考虑词语在句子中的语义角色以及整个文档的主题,能够更准确地判断隐喻的存在和含义。此外,利用LLM进行语义分析也提高了隐喻识别的准确性和效率。

关键设计:论文的关键设计包括:1) 词级信号:使用LLM计算推文中每个词语与目标概念的语义相似度。2) 文档级信号:使用LLM对整个推文进行编码,并计算其与目标概念的相似度。3) 隐喻得分:将词级和文档级信号进行加权组合,得到一个综合的隐喻得分,用于衡量推文中使用特定隐喻的程度。具体的加权方式和LLM的选择可能需要根据实际情况进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

研究发现,保守派用户倾向于比自由派用户更多地使用非人化隐喻,但这种趋势在不同概念之间存在差异。此外,与生物相关的隐喻(如将移民比作动物)与更高的用户参与度(转发量)相关,尤其是在自由派用户中。这些发现揭示了隐喻在政治传播中的复杂作用,以及不同政治立场的人们对隐喻的不同反应。

🎯 应用场景

该研究成果可应用于政治传播分析、舆情监控、社会情绪感知等领域。通过识别和量化政治讨论中的隐喻,可以更好地理解公众对特定议题的认知和态度,揭示潜在的偏见和歧视,并为政策制定者提供参考。此外,该方法还可以推广到其他领域的隐喻分析,例如商业营销、健康传播等。

📄 摘要(原文)

Metaphor, discussing one concept in terms of another, is abundant in politics and can shape how people understand important issues. We develop a computational approach to measure metaphorical language, focusing on immigration discourse on social media. Grounded in qualitative social science research, we identify seven concepts evoked in immigration discourse (e.g. "water" or "vermin"). We propose and evaluate a novel technique that leverages both word-level and document-level signals to measure metaphor with respect to these concepts. We then study the relationship between metaphor, political ideology, and user engagement in 400K US tweets about immigration. While conservatives tend to use dehumanizing metaphors more than liberals, this effect varies widely across concepts. Moreover, creature-related metaphor is associated with more retweets, especially for liberal authors. Our work highlights the potential for computational methods to complement qualitative approaches in understanding subtle and implicit language in political discourse.