Do Political Opinions Transfer Between Western Languages? An Analysis of Unaligned and Aligned Multilingual LLMs

📄 arXiv: 2508.05553v2 📥 PDF

作者: Franziska Weeber, Tanise Ceron, Sebastian Padó

分类: cs.CL, cs.CY

发布日期: 2025-08-07 (更新: 2026-01-21)

备注: EACL2026


💡 一句话要点

研究多语言LLM中政治观点的跨语言迁移现象,揭示文化政治倾向的潜在影响。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多语言LLM 政治观点 跨语言迁移 文化偏见 直接偏好优化

📋 核心要点

  1. 现有研究缺乏对多语言LLM中跨语言政治观点差异的深入分析,无法确定文化差异是否影响模型。
  2. 该研究通过评估MLLM对政治声明的同意程度,分析政治观点在不同语言间的迁移情况,揭示模型潜在的文化倾向。
  3. 实验表明,未对齐模型跨语言政治观点差异小,政治对齐操作会统一改变所有语言的观点,表明观点迁移现象。

📝 摘要(中文)

公共舆论调查显示,不同社会文化背景下,人们的政治观点存在跨文化差异。然而,这些差异是否会转化为多语言大型语言模型(MLLM)中的跨语言差异尚不明确。本文分析了五种西方语言的各种规模的MLLM中,政治观点是否在语言之间迁移,或者每种语言是否存在独立的观点。我们通过提示MLLM报告其对投票建议应用程序中政治声明的(不)同意程度来评估其观点。为了更好地理解模型中语言之间的交互,我们在使用直接偏好优化和仅使用英语对齐数据将它们与更左或更右的观点对齐之前和之后都对其进行了评估。我们的研究结果表明,未对齐的模型在它们反映的政治观点中仅显示出非常少的显着跨语言差异。政治对齐几乎一致地改变了所有五种语言的观点。我们得出结论,在西方语言环境中,政治观点在语言之间迁移,这表明在实现MLLM的明确社会语言、文化和政治对齐方面存在挑战。

🔬 方法详解

问题定义:论文旨在研究多语言大型语言模型(MLLM)在不同语言之间是否会迁移政治观点。现有方法缺乏对MLLM跨语言政治观点差异的系统性分析,无法确定模型是否受到特定语言或文化背景的影响,从而可能导致模型在不同语言环境下产生偏差。

核心思路:论文的核心思路是通过评估MLLM对政治声明的赞同程度,来推断模型在不同语言下的政治立场。通过比较模型在不同语言下的政治立场,可以分析政治观点是否在语言之间迁移。此外,通过对模型进行政治对齐(使其倾向于左翼或右翼),可以进一步研究语言之间的交互作用以及政治观点迁移的影响。

技术框架:该研究的技术框架主要包括以下几个步骤:1) 选择五种西方语言的MLLM进行评估;2) 从投票建议应用程序中选取政治声明作为评估材料;3) 提示MLLM用不同语言报告其对政治声明的同意程度;4) 使用直接偏好优化(Direct Preference Optimization, DPO)和仅使用英语对齐数据对模型进行政治对齐,使其倾向于左翼或右翼;5) 比较对齐前后模型在不同语言下的政治立场,分析政治观点是否在语言之间迁移。

关键创新:该研究的关键创新在于:1) 首次系统性地研究了MLLM中政治观点的跨语言迁移现象;2) 通过对模型进行政治对齐,深入分析了语言之间的交互作用以及政治观点迁移的影响;3) 揭示了在西方语言环境中,政治观点在语言之间迁移,这表明在实现MLLM的明确社会语言、文化和政治对齐方面存在挑战。

关键设计:在实验设计方面,论文选择了五种西方语言(英语、法语、德语、西班牙语、意大利语),这些语言之间具有一定的相似性,便于进行跨语言比较。在政治对齐方面,论文使用了直接偏好优化(DPO)算法,该算法可以直接优化模型的偏好,而无需进行复杂的奖励建模。此外,论文仅使用英语对齐数据进行政治对齐,以研究英语对齐数据对其他语言的影响。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,未经政治对齐的MLLM在不同西方语言中表现出相似的政治观点,跨语言差异较小。然而,通过仅使用英语数据进行政治对齐后,所有五种语言的政治观点都发生了几乎一致的转变,表明政治观点在语言间存在显著的迁移现象。这突显了在多语言模型中实现特定文化或政治立场的挑战。

🎯 应用场景

该研究成果可应用于提升多语言LLM的公平性和避免文化偏见。通过了解政治观点在不同语言间的迁移方式,可以设计更有效的干预措施,减少模型在特定文化或政治背景下的偏差。这对于开发更可靠、更公正的跨语言AI系统至关重要,尤其是在涉及公共政策、社会服务等敏感领域的应用中。

📄 摘要(原文)

Public opinion surveys show cross-cultural differences in political opinions between socio-cultural contexts. However, there is no clear evidence whether these differences translate to cross-lingual differences in multilingual large language models (MLLMs). We analyze whether opinions transfer between languages or whether there are separate opinions for each language in MLLMs of various sizes across five Western languages. We evaluate MLLMs' opinions by prompting them to report their (dis)agreement with political statements from voting advice applications. To better understand the interaction between languages in the models, we evaluate them both before and after aligning them with more left or right views using direct preference optimization and English alignment data only. Our findings reveal that unaligned models show only very few significant cross-lingual differences in the political opinions they reflect. The political alignment shifts opinions almost uniformly across all five languages. We conclude that in Western language contexts, political opinions transfer between languages, demonstrating the challenges in achieving explicit socio-linguistic, cultural, and political alignment of MLLMs.