A Survey on Human-Centric LLMs

📄 arXiv: 2411.14491v3 📥 PDF

作者: Jing Yi Wang, Nicholas Sukiennik, Tong Li, Weikang Su, Qianyue Hao, Jingbo Xu, Zihan Huang, Fengli Xu, Yong Li

分类: cs.CL, cs.AI

发布日期: 2024-11-20 (更新: 2024-12-01)


💡 一句话要点

综述:以人为本的大语言模型能力、应用与挑战

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 人机交互 认知模拟 社会行为 行为科学 政治学 社会学

📋 核心要点

  1. 现有LLM在模拟人类认知、决策和社会互动方面存在局限性,尤其是在适应性、情商和文化敏感性方面。
  2. 该综述从以人为本的视角,全面评估LLM在个体和集体任务中模拟人类行为和互动方面的能力。
  3. 该研究识别了LLM在推理、感知和社会认知等关键领域的优势与不足,并探讨了其在行为科学等领域的应用。

📝 摘要(中文)

大型语言模型(LLM)的快速发展及其模拟人类认知和行为的能力,催生了基于LLM的框架和工具,这些框架和工具的评估和应用都基于它们执行传统上由人类执行的任务的能力,即那些涉及认知、决策和社会互动的任务。本综述全面考察了这种以人为本的LLM能力,重点关注它们在个体任务(LLM充当单个人的替身)和集体任务(多个LLM协调以模仿群体动态)中的表现。我们首先评估LLM在推理、感知和社会认知等关键领域的竞争力,将它们的能力与类人技能进行比较。然后,我们探讨LLM在行为科学、政治学和社会学等以人为本的领域的实际应用,评估它们在复制人类行为和互动方面的有效性。最后,我们确定了挑战和未来的研究方向,例如提高LLM的适应性、情商和文化敏感性,同时解决固有的偏见并加强人机协作框架。本综述旨在提供对LLM以人为本视角的初步理解,从而深入了解它们当前的能力和未来发展的潜力。

🔬 方法详解

问题定义:论文旨在全面评估和分析大型语言模型(LLM)在模拟人类认知、行为和社会互动方面的能力。现有方法主要关注LLM在特定任务上的性能,缺乏对LLM以人为本能力的系统性评估,尤其是在适应性、情商、文化敏感性以及潜在偏见等方面。

核心思路:论文的核心思路是从以人为本的视角出发,将LLM视为人类的替身或群体互动的模拟器,系统性地评估LLM在个体任务(如推理、感知)和集体任务(如群体决策)中的表现。通过对比LLM与人类在这些任务中的表现,揭示LLM的优势与不足,并探讨其在实际应用中的潜力。

技术框架:该综述没有提出新的技术框架,而是对现有研究进行梳理和归纳。其整体框架包括:1) 评估LLM在推理、感知和社会认知等关键领域的竞争力;2) 探讨LLM在行为科学、政治学和社会学等领域的实际应用;3) 识别LLM面临的挑战和未来的研究方向,如提高LLM的适应性、情商和文化敏感性,解决固有的偏见,以及加强人机协作框架。

关键创新:该综述的创新之处在于其以人为本的视角,它不是简单地评估LLM在技术任务上的性能,而是关注LLM在模拟人类行为和互动方面的能力。这种视角有助于更全面地理解LLM的潜力和局限性,并为未来的研究提供新的方向。

关键设计:该综述的关键设计在于其评估指标的选择和应用场景的选取。评估指标涵盖了LLM在推理、感知和社会认知等多个方面的能力,应用场景则包括行为科学、政治学和社会学等多个领域。通过对这些指标和场景的分析,可以更全面地了解LLM的以人为本能力。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该综述系统性地评估了LLM在模拟人类认知、行为和社会互动方面的能力,揭示了LLM在推理、感知和社会认知等方面的优势与不足。同时,该综述还探讨了LLM在行为科学、政治学和社会学等领域的实际应用,并指出了未来研究的挑战和方向。

🎯 应用场景

该研究成果可应用于行为科学、政治学、社会学等领域,例如,利用LLM模拟人类行为进行社会实验,或辅助决策制定。此外,该研究还有助于开发更具适应性、情商和文化敏感性的LLM,从而促进人机协作。

📄 摘要(原文)

The rapid evolution of large language models (LLMs) and their capacity to simulate human cognition and behavior has given rise to LLM-based frameworks and tools that are evaluated and applied based on their ability to perform tasks traditionally performed by humans, namely those involving cognition, decision-making, and social interaction. This survey provides a comprehensive examination of such human-centric LLM capabilities, focusing on their performance in both individual tasks (where an LLM acts as a stand-in for a single human) and collective tasks (where multiple LLMs coordinate to mimic group dynamics). We first evaluate LLM competencies across key areas including reasoning, perception, and social cognition, comparing their abilities to human-like skills. Then, we explore real-world applications of LLMs in human-centric domains such as behavioral science, political science, and sociology, assessing their effectiveness in replicating human behaviors and interactions. Finally, we identify challenges and future research directions, such as improving LLM adaptability, emotional intelligence, and cultural sensitivity, while addressing inherent biases and enhancing frameworks for human-AI collaboration. This survey aims to provide a foundational understanding of LLMs from a human-centric perspective, offering insights into their current capabilities and potential for future development.