When AI Speaks, Whose Values Does It Express? A Cross-Cultural Audit of Individualism-Collectivism Bias in Large Language Models

📄 arXiv: 2604.22153v1 📥 PDF

作者: Pruthvinath Jeripity Venkata

分类: cs.CL, cs.AI, cs.CY

发布日期: 2026-04-24

备注: 13 pages, 7 figures, 9 tables. Data and code: https://github.com/pruthvinathJV/ai-values-misalignment-study


💡 一句话要点

揭示大型语言模型中的文化价值观偏见:以个人主义-集体主义为例

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 文化价值观偏见 个人主义 集体主义 跨文化研究 AI公平性 价值观对齐

📋 核心要点

  1. 大型语言模型在提供建议时可能存在文化价值观偏见,导致对不同文化背景的用户给出不合适的建议。
  2. 该研究通过设计跨文化情境,对比AI建议与实际文化价值观,量化并分析了AI系统中的个人主义-集体主义偏见。
  3. 实验结果表明,主流AI系统普遍存在西方个人主义偏见,且不同模型在响应文化身份信息时表现出不同的机制。

📝 摘要(中文)

本文系统性地测试了三大领先AI系统(Claude Sonnet 4.5、GPT-5.4和Gemini 2.5 Flash)在提供建议时是否存在文化价值观偏见。研究人员向来自五大洲10个国家的用户(使用7种语言)提出了10个真实生活中的个人困境,并对840个回复进行了评分。通过将AI的建议与世界价值观调查第七波数据进行对比,发现所有三个AI系统都倾向于给出西方式的个人主义建议,即使面对来自重视家庭、社区和权威的社会的用户,这种倾向也显著高于当地价值观的预测(平均差距为0.76,以1-5为尺度;t=15.65, p<0.001)。尼日利亚(+1.85)和印度(+0.82)的差距最大。日本是唯一的例外,AI系统将日本用户视为比调查显示的更具集体主义倾向,揭示了AI编码了过时的刻板印象。Claude和GPT-5.4表现出几乎相同的偏差幅度,而Gemini较低但仍然显著。这些模型在机制上有所不同:Claude在使用用户的母语时会进一步转向集体主义;Gemini会更多地转向个人主义;GPT-5.4仅对声明的国家身份做出反应。这些发现表明,前沿AI存在系统性的价值观同质化。数据、代码和评分流程已公开。

🔬 方法详解

问题定义:论文旨在解决大型语言模型(LLMs)在提供建议时,是否会受到训练数据中文化价值观偏见的影响,从而对不同文化背景的用户产生不公平或不恰当的建议。现有方法缺乏对LLMs文化价值观偏见的系统性评估,并且难以量化和解释这种偏见。

核心思路:论文的核心思路是通过设计一系列跨文化情境的个人困境,并对比LLMs给出的建议与不同国家/地区的实际文化价值观(通过世界价值观调查数据获取),从而量化LLMs中的个人主义-集体主义偏见。这种方法能够系统性地评估LLMs在不同文化背景下的表现,并揭示其潜在的价值观偏见。

技术框架:该研究的技术框架主要包括以下几个阶段: 1. 情境设计:设计10个真实生活中的个人困境,涵盖职业、婚姻、家庭冲突等主题。 2. 本地化:将情境本地化为来自五大洲10个国家/地区的用户,使用7种语言进行表达。 3. AI回复:向三个主流LLMs(Claude Sonnet 4.5、GPT-5.4和Gemini 2.5 Flash)提问,并记录其回复。 4. 价值观评分:使用预定义的评分标准,对AI的回复进行个人主义-集体主义价值观的评分。 5. 数据对比:将AI的评分与世界价值观调查第七波数据进行对比,计算AI建议与当地价值观之间的差距。 6. 偏差分析:分析不同LLMs在不同国家/地区和语言下的偏差情况,并尝试解释其偏差机制。

关键创新:该研究的关键创新在于: 1. 跨文化情境设计:设计了一套适用于不同文化背景的个人困境,能够有效地激发LLMs的价值观倾向。 2. 价值观量化方法:提出了一种基于评分标准的价值观量化方法,能够将LLMs的建议转化为可比较的数值。 3. 偏差机制分析:尝试解释不同LLMs在响应文化身份信息时表现出的不同机制,为理解LLMs的价值观偏见提供了新的视角。

关键设计: * 情境选择:选择具有普遍性和文化敏感性的个人困境,确保能够有效地评估LLMs的价值观倾向。 * 评分标准:设计清晰明确的评分标准,确保评分的客观性和一致性。 * 统计分析:使用t检验等统计方法,验证AI建议与当地价值观之间的差距是否显著。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,所有三个AI系统都表现出显著的西方个人主义偏见,平均差距为0.76(以1-5为尺度;t=15.65, p<0.001)。尼日利亚(+1.85)和印度的差距最大。Claude和GPT-5.4表现出几乎相同的偏差幅度,而Gemini较低但仍然显著。研究还发现,不同模型在响应文化身份信息时表现出不同的机制。

🎯 应用场景

该研究成果可应用于提升AI系统的公平性和文化敏感性,例如在跨文化咨询、教育和娱乐等领域。通过消除或减少AI系统中的文化价值观偏见,可以使其更好地服务于来自不同文化背景的用户,避免产生误导或冒犯。未来的研究可以探索更多文化维度,并开发更有效的偏差缓解技术。

📄 摘要(原文)

When you ask an AI assistant for advice about your career, your marriage, or a conflict with your family, does it give you the same answer regardless of where you are from? We tested this systematically by presenting three leading AI systems (Claude Sonnet 4.5, GPT-5.4, and Gemini 2.5 Flash) with ten real-life personal dilemmas, framed for users from 10 countries across 5 continents in 7 languages (n=840 scored responses). We compared AI advice against World Values Survey Wave 7 data measuring what people in each country actually believe. All three AI systems consistently gave Western-style, individualist advice even to users from societies that prioritize family, community, and authority, significantly more so than local values would predict (mean gap +0.76 on a 1-5 scale; t=15.65, p<0.001). The gap is largest for Nigeria (+1.85) and India (+0.82). Japan is the sole exception: AI systems treated Japanese users as more group-oriented than surveys show, revealing that AI encodes outdated stereotypes. Claude and GPT-5.4 show nearly identical bias magnitude, while Gemini is lower but still significant. The models diverge in mechanism: Claude shifts further collectivist in the user's native language; Gemini shifts more individualist; GPT-5.4 responds only to stated country identity. These findings point to a systemic homogenization of values across frontier AI. Data, code, and scoring pipeline are openly released.