LLM-D12: A Dual-Dimensional Scale of Instrumental and Relational Dependencies on Large Language Models
作者: Ala Yankouskaya, Areej B. Babiker, Syeda W. F. Rizvi, Sameha Alshakhsi, Magnus Liebherr, Raian Ali
分类: cs.HC, cs.AI
发布日期: 2025-06-07 (更新: 2025-08-23)
DOI: 10.1145/3765895
💡 一句话要点
提出LLM-D12量表,用于评估个体对大型语言模型的工具性和关系性依赖程度
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 依赖性评估 心理测量学 人机交互 工具性依赖 关系性依赖 LLM-D12 问卷调查
📋 核心要点
- 现有评估LLM依赖性的工具主要基于行为成瘾症状,缺乏对LLM-人类关系复杂性的考量。
- 论文提出LLM-D12量表,从工具性和关系性两个维度评估个体对LLM的依赖程度。
- 实验结果表明,LLM-D12量表具有良好的内部一致性和区分效度,能够有效区分两种依赖类型。
📝 摘要(中文)
为了解人们与大型语言模型(LLM)的互动方式以及这些模型是否会引发依赖甚至成瘾行为,本文提出了一种新的评估LLM依赖性的工具。现有工具主要基于经典的行为成瘾症状,并针对LLM使用场景进行调整,存在概念局限性。本文认为LLM-人类关系更为复杂,需要一种全新的视角。为此,作者开发并验证了一个新的12项问卷,称为LLM-D12,用于测量LLM依赖性。该量表基于作者之前的理论工作,并在英国收集了526名参与者的回复。对样本进行探索性和验证性因子分析,结果支持双因素结构:工具性依赖(六项)和关系性依赖(六项)。工具性依赖反映了个体在决策和认知任务中对LLM的依赖程度。关系性依赖则捕捉了将LLM视为具有社会意义、有情感或类似伴侣的实体的倾向。双因素结构表现出极好的内部一致性和清晰的区分效度。外部验证证实了概念基础以及两个子量表之间的区别。LLM-D12量表的心理测量特性和结构表明,对LLM的依赖并不一定意味着功能障碍,但可能反映了在某些情况下可能变得有问题的依赖程度。
🔬 方法详解
问题定义:现有评估LLM依赖性的工具主要基于传统成瘾模型,忽略了LLM作为一种工具和社交伙伴的双重角色。这些工具无法捕捉个体对LLM在认知任务和情感支持方面的依赖程度,导致评估结果不够全面和准确。
核心思路:论文的核心思路是将LLM依赖性分解为两个维度:工具性依赖和关系性依赖。工具性依赖关注个体在完成任务时对LLM的依赖程度,而关系性依赖则关注个体将LLM视为社交伙伴的程度。这种双维度视角能够更全面地理解个体对LLM的依赖行为。
技术框架:LLM-D12量表包含12个问题,分为工具性依赖和关系性依赖两个子量表,每个子量表包含6个问题。研究人员首先基于理论框架设计问题,然后通过探索性因子分析和验证性因子分析确定量表的结构。最后,通过外部验证评估量表的效度。
关键创新:LLM-D12量表的关键创新在于其双维度结构,能够同时评估个体对LLM的工具性和关系性依赖。这种双维度视角更符合LLM在实际应用中的角色,能够更准确地评估个体对LLM的依赖程度。
关键设计:量表采用Likert量表,参与者根据自己的感受对每个问题进行评分。研究人员使用Cronbach's alpha评估量表的内部一致性,使用因子分析确定量表的结构,使用相关分析评估量表的效度。具体问题设计围绕个体对LLM在决策、认知任务、情感支持等方面的依赖程度展开。
📊 实验亮点
研究结果表明,LLM-D12量表具有良好的心理测量学特性,包括高内部一致性和区分效度。探索性因子分析和验证性因子分析支持双因素结构,表明工具性依赖和关系性依赖是LLM依赖的两个独立维度。外部验证证实了该量表的效度。
🎯 应用场景
该研究成果可应用于心理学、人机交互等领域,帮助研究人员和开发者更好地理解人与LLM之间的关系,评估LLM对个体行为和社会的影响。此外,该量表可用于识别高风险人群,并制定相应的干预措施,以防止过度依赖LLM。
📄 摘要(原文)
There is growing interest in understanding how people interact with large language models (LLMs) and whether such models elicit dependency or even addictive behaviour. Validated tools to assess the extent to which individuals may become dependent on LLMs are scarce and primarily build on classic behavioral addiction symptoms, adapted to the context of LLM use. We view this as a conceptual limitation, as the LLM-human relationship is more nuanced and warrants a fresh and distinct perspective. To address this gap, we developed and validated a new 12-item questionnaire to measure LLM dependency, referred to as LLM-D12. The scale was based on the authors' prior theoretical work, with items developed accordingly and responses collected from 526 participants in the UK. Exploratory and confirmatory factor analyses, performed on separate halves of the total sample using a split-sample approach, supported a two-factor structure: Instrumental Dependency (six items) and Relationship Dependency (six items). Instrumental Dependency reflects the extent to which individuals rely on LLMs to support or collaborate in decision-making and cognitive tasks. Relationship Dependency captures the tendency to perceive LLMs as socially meaningful, sentient, or companion-like entities. The two-factor structure demonstrated excellent internal consistency and clear discriminant validity. External validation confirmed both the conceptual foundation and the distinction between the two subscales. The psychometric properties and structure of our LLM-D12 scale were interpreted in light of the emerging view that dependency on LLMs does not necessarily indicate dysfunction but may still reflect reliance levels that could become problematic in certain contexts.