The Curious Case of Curiosity across Human Cultures and LLMs

作者: Angana Borah, Zhijing Jin, Rada Mihalcea

分类: cs.CL

发布日期: 2025-10-14 (更新: 2025-10-20)

备注: Preprint (Paper under review)

💡 一句话要点

提出CUEST框架，揭示LLM在跨文化好奇心表达上的偏差并提出优化方案。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 跨文化研究 好奇心 人机交互 评估框架

📋 核心要点

现有LLM在跨文化好奇心表达方面存在不足，未能充分捕捉不同文化的好奇心差异。
论文提出CUEST框架，通过语言风格和主题偏好分析，评估LLM与人类在好奇心表达上的一致性。
实验表明，LLM在跨文化好奇心表达上存在偏差，通过微调可显著提升LLM的跨文化适应性。

📝 摘要（中文）

大型语言模型（LLM）在人机交互中的作用日益重要，但好奇心这一重要的探索驱动力在这些系统中仍未得到充分研究，尤其是在跨文化背景下。本文利用Yahoo! Answers这一涵盖多种主题的真实多国数据集，研究了好奇心的文化差异。我们提出了CUEST（跨社会好奇心评估）框架，通过语言风格、主题偏好分析以及社会科学结构的 grounding insights 来衡量人类与模型在好奇心表达上的一致性。研究发现，无论开源还是闭源模型，LLM都倾向于抹平跨文化差异，更接近西方国家的好奇心表达方式。我们进一步探索了微调策略以诱导LLM的好奇心，从而缩小了人机一致性差距高达50%。最后，我们展示了好奇心对于LLM跨文化适应性的实际价值，强调了其对未来NLP研究的重要性。

🔬 方法详解

问题定义：论文旨在解决大型语言模型（LLM）在跨文化好奇心表达上的不足问题。现有LLM在理解和生成不同文化背景下的好奇心表达时，往往表现出偏差，未能充分捕捉不同文化的好奇心差异。这限制了LLM在跨文化人机交互中的应用，例如在教育、娱乐等领域，LLM可能无法有效地激发用户的学习兴趣或提供个性化的内容推荐。

核心思路：论文的核心思路是通过构建一个跨文化好奇心评估框架（CUEST），来量化LLM在不同文化背景下的好奇心表达能力，并利用微调策略来提升LLM的跨文化适应性。CUEST框架通过分析LLM的语言风格、主题偏好以及与社会科学理论的对齐程度，来评估LLM与人类在好奇心表达上的一致性。

技术框架：论文的技术框架主要包含三个阶段：1) 数据收集与预处理：收集来自Yahoo! Answers的多国数据集，并进行清洗和标注，以区分不同文化背景下的好奇心表达。2) CUEST框架构建：设计CUEST框架，包括语言风格分析模块、主题偏好分析模块和社会科学 grounding 模块。3) 微调与评估：利用收集的数据和CUEST框架，对LLM进行微调，并评估微调后的LLM在跨文化好奇心表达上的提升。

关键创新：论文的关键创新在于提出了CUEST框架，这是一个专门用于评估LLM在跨文化好奇心表达能力的综合性评估框架。与现有方法相比，CUEST框架不仅考虑了语言风格和主题偏好，还融入了社会科学理论，从而能够更全面、更准确地评估LLM的好奇心表达能力。此外，论文还探索了微调策略，有效地提升了LLM的跨文化适应性。

关键设计：CUEST框架的关键设计包括：1) 语言风格分析模块：利用词汇多样性、句法复杂度等指标来衡量LLM的语言风格，并与不同文化背景下的语言风格进行比较。2) 主题偏好分析模块：分析LLM在不同主题上的提问频率和回答质量，以评估LLM对不同主题的兴趣程度。3) 社会科学 grounding 模块：将LLM的好奇心表达与社会科学理论（如信息差距理论、认知评价理论）进行对齐，以评估LLM的好奇心表达是否符合人类的认知规律。微调策略的关键设计包括：1) 使用对比学习损失函数，鼓励LLM学习不同文化背景下的好奇心表达方式。2) 使用多任务学习，同时优化LLM的语言生成能力和好奇心表达能力。

🖼️ 关键图片

📊 实验亮点

实验结果表明，LLM在跨文化好奇心表达上存在显著偏差，更接近西方国家的好奇心表达方式。通过微调，人机一致性差距缩小了高达50%。此外，实验还证明了好奇心对于LLM跨文化适应性的重要性，表明具备好奇心的LLM在跨文化任务中表现更佳。

🎯 应用场景

该研究成果可应用于多个领域，例如：1) 跨文化教育：帮助LLM更好地理解和满足不同文化背景学生的学习需求。2) 个性化推荐：根据用户的文化背景和兴趣，提供更精准的内容推荐。3) 跨文化交流：促进不同文化背景人群之间的理解和沟通。未来，该研究有望推动LLM在跨文化人机交互领域的发展。

📄 摘要（原文）

Recent advances in Large Language Models (LLMs) have expanded their role in human interaction, yet curiosity -- a central driver of inquiry -- remains underexplored in these systems, particularly across cultural contexts. In this work, we investigate cultural variation in curiosity using Yahoo! Answers, a real-world multi-country dataset spanning diverse topics. We introduce CUEST (CUriosity Evaluation across SocieTies), an evaluation framework that measures human-model alignment in curiosity through linguistic (style), topic preference (content) analysis and grounding insights in social science constructs. Across open- and closed-source models, we find that LLMs flatten cross-cultural diversity, aligning more closely with how curiosity is expressed in Western countries. We then explore fine-tuning strategies to induce curiosity in LLMs, narrowing the human-model alignment gap by up to 50%. Finally, we demonstrate the practical value of curiosity for LLM adaptability across cultures, showing its importance for future NLP research.

The Curious Case of Curiosity across Human Cultures and LLMs

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理