The Curious Case of Curiosity across Human Cultures and LLMs

📄 arXiv: 2510.12943v2 📥 PDF

作者: Angana Borah, Zhijing Jin, Rada Mihalcea

分类: cs.CL

发布日期: 2025-10-14 (更新: 2025-10-20)

备注: Preprint (Paper under review)


💡 一句话要点

提出CUEST框架,揭示LLM在跨文化好奇心表达上的偏差并提出优化方案。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 跨文化研究 好奇心 人机交互 评估框架

📋 核心要点

  1. 现有LLM在跨文化好奇心表达方面存在不足,未能充分捕捉不同文化的好奇心差异。
  2. 论文提出CUEST框架,通过语言风格和主题偏好分析,评估LLM与人类在好奇心表达上的一致性。
  3. 实验表明,LLM在跨文化好奇心表达上存在偏差,通过微调可显著提升LLM的跨文化适应性。

📝 摘要(中文)

大型语言模型(LLM)在人机交互中的作用日益重要,但好奇心这一重要的探索驱动力在这些系统中仍未得到充分研究,尤其是在跨文化背景下。本文利用Yahoo! Answers这一涵盖多种主题的真实多国数据集,研究了好奇心的文化差异。我们提出了CUEST(跨社会好奇心评估)框架,通过语言风格、主题偏好分析以及社会科学结构的 grounding insights 来衡量人类与模型在好奇心表达上的一致性。研究发现,无论开源还是闭源模型,LLM都倾向于抹平跨文化差异,更接近西方国家的好奇心表达方式。我们进一步探索了微调策略以诱导LLM的好奇心,从而缩小了人机一致性差距高达50%。最后,我们展示了好奇心对于LLM跨文化适应性的实际价值,强调了其对未来NLP研究的重要性。

🔬 方法详解

问题定义:论文旨在解决大型语言模型(LLM)在跨文化好奇心表达上的不足问题。现有LLM在理解和生成不同文化背景下的好奇心表达时,往往表现出偏差,未能充分捕捉不同文化的好奇心差异。这限制了LLM在跨文化人机交互中的应用,例如在教育、娱乐等领域,LLM可能无法有效地激发用户的学习兴趣或提供个性化的内容推荐。

核心思路:论文的核心思路是通过构建一个跨文化好奇心评估框架(CUEST),来量化LLM在不同文化背景下的好奇心表达能力,并利用微调策略来提升LLM的跨文化适应性。CUEST框架通过分析LLM的语言风格、主题偏好以及与社会科学理论的对齐程度,来评估LLM与人类在好奇心表达上的一致性。

技术框架:论文的技术框架主要包含三个阶段:1) 数据收集与预处理:收集来自Yahoo! Answers的多国数据集,并进行清洗和标注,以区分不同文化背景下的好奇心表达。2) CUEST框架构建:设计CUEST框架,包括语言风格分析模块、主题偏好分析模块和社会科学 grounding 模块。3) 微调与评估:利用收集的数据和CUEST框架,对LLM进行微调,并评估微调后的LLM在跨文化好奇心表达上的提升。

关键创新:论文的关键创新在于提出了CUEST框架,这是一个专门用于评估LLM在跨文化好奇心表达能力的综合性评估框架。与现有方法相比,CUEST框架不仅考虑了语言风格和主题偏好,还融入了社会科学理论,从而能够更全面、更准确地评估LLM的好奇心表达能力。此外,论文还探索了微调策略,有效地提升了LLM的跨文化适应性。

关键设计:CUEST框架的关键设计包括:1) 语言风格分析模块:利用词汇多样性、句法复杂度等指标来衡量LLM的语言风格,并与不同文化背景下的语言风格进行比较。2) 主题偏好分析模块:分析LLM在不同主题上的提问频率和回答质量,以评估LLM对不同主题的兴趣程度。3) 社会科学 grounding 模块:将LLM的好奇心表达与社会科学理论(如信息差距理论、认知评价理论)进行对齐,以评估LLM的好奇心表达是否符合人类的认知规律。微调策略的关键设计包括:1) 使用对比学习损失函数,鼓励LLM学习不同文化背景下的好奇心表达方式。2) 使用多任务学习,同时优化LLM的语言生成能力和好奇心表达能力。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,LLM在跨文化好奇心表达上存在显著偏差,更接近西方国家的好奇心表达方式。通过微调,人机一致性差距缩小了高达50%。此外,实验还证明了好奇心对于LLM跨文化适应性的重要性,表明具备好奇心的LLM在跨文化任务中表现更佳。

🎯 应用场景

该研究成果可应用于多个领域,例如:1) 跨文化教育:帮助LLM更好地理解和满足不同文化背景学生的学习需求。2) 个性化推荐:根据用户的文化背景和兴趣,提供更精准的内容推荐。3) 跨文化交流:促进不同文化背景人群之间的理解和沟通。未来,该研究有望推动LLM在跨文化人机交互领域的发展。

📄 摘要(原文)

Recent advances in Large Language Models (LLMs) have expanded their role in human interaction, yet curiosity -- a central driver of inquiry -- remains underexplored in these systems, particularly across cultural contexts. In this work, we investigate cultural variation in curiosity using Yahoo! Answers, a real-world multi-country dataset spanning diverse topics. We introduce CUEST (CUriosity Evaluation across SocieTies), an evaluation framework that measures human-model alignment in curiosity through linguistic (style), topic preference (content) analysis and grounding insights in social science constructs. Across open- and closed-source models, we find that LLMs flatten cross-cultural diversity, aligning more closely with how curiosity is expressed in Western countries. We then explore fine-tuning strategies to induce curiosity in LLMs, narrowing the human-model alignment gap by up to 50%. Finally, we demonstrate the practical value of curiosity for LLM adaptability across cultures, showing its importance for future NLP research.