Internal World Models as Imagination Networks in Cognitive Agents
作者: Saurabh Ranjan, Brian Odegaard
分类: cs.AI, cs.CL, cs.SI, q-bio.NC
发布日期: 2025-10-05 (更新: 2025-12-07)
💡 一句话要点
提出心理网络分析方法以比较人类与大型语言模型的内部世界模型
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 内部世界模型 想象网络 心理网络分析 大型语言模型 生动性问卷 认知代理 人工智能
📋 核心要点
- 现有方法对想象的计算角色理解不足,主要集中在奖励最大化,缺乏对内部世界模型的深入探讨。
- 本研究提出通过心理网络分析比较人类与大型语言模型的内部世界模型,利用生动性问卷构建想象网络。
- 实验结果显示人类想象网络在中心性和聚类上表现出显著一致性,而LLM网络则显示出较弱的聚类和中心性相关性。
📝 摘要(中文)
想象的计算角色仍然存在争议。传统观点强调奖励最大化,而新兴证据表明想象具有更广泛的功能:访问内部世界模型(IWMs)。本研究通过心理网络分析比较人类和大型语言模型(LLMs)的IWMs,使用视觉意象生动性问卷(VVIQ-2)和普利茅斯感官意象问卷(PSIQ),构建了来自三个人类群体(佛罗里达、波兰、伦敦;N=2,743)和六种LLM变体的想象网络。人类想象网络在中心性度量(预期影响、强度、接近度)上表现出强相关性和一致的聚类模式,表明不同人群之间IWMs的结构组织共享。相比之下,LLM派生的网络显示出最小的聚类和弱中心性相关性。这些系统性差异在环境场景(VVIQ-2)和感官模态(PSIQ)中持续存在,揭示了人类与人工世界模型之间的根本差异。我们的网络基础方法为比较认知代理的内部生成表征提供了定量框架,对开发类人想象的人工智能系统具有重要意义。
🔬 方法详解
问题定义:本研究旨在解决人类与大型语言模型在内部世界模型(IWMs)方面的比较问题。现有方法主要关注奖励最大化,未能充分探讨想象的更广泛功能。
核心思路:通过心理网络分析,利用生动性问卷构建想象网络,以定量比较人类与LLMs的IWMs,揭示其结构差异。
技术框架:研究分为几个主要模块:首先,收集来自不同人群的生动性评分;其次,构建人类和LLM的想象网络;最后,分析网络的中心性和聚类特征。
关键创新:本研究的创新点在于采用网络分析方法定量比较IWMs,揭示了人类与人工智能在想象能力上的根本差异,提供了新的视角。
关键设计:使用VVIQ-2和PSIQ问卷收集数据,构建网络时考虑了中心性度量(如预期影响、强度、接近度)和聚类模式,确保了分析的全面性和准确性。
📊 实验亮点
实验结果显示,人类想象网络在中心性度量上表现出强相关性和一致的聚类模式,而LLM网络则几乎没有聚类,中心性相关性也较弱。这一发现揭示了人类与人工智能在IWMs方面的根本差异,具有重要的理论和实践意义。
🎯 应用场景
该研究的潜在应用领域包括人工智能系统的开发,特别是在增强机器的想象能力和认知功能方面。通过理解人类的IWMs,未来的AI系统可以更好地模拟人类思维过程,提高人机交互的自然性和有效性。
📄 摘要(原文)
The computational role of imagination remains debated. While classical accounts emphasize reward maximization, emerging evidence suggests imagination serves a broader function: accessing internal world models (IWMs). Here, we employ psychological network analysis to compare IWMs in humans and large language models (LLMs) through imagination vividness ratings. Using the Vividness of Visual Imagery Questionnaire (VVIQ-2) and Plymouth Sensory Imagery Questionnaire (PSIQ), we construct imagination networks from three human populations (Florida, Poland, London; N=2,743) and six LLM variants in two conversation conditions. Human imagination networks demonstrate robust correlations across centrality measures (expected influence, strength, closeness) and consistent clustering patterns, indicating shared structural organization of IWMs across populations. In contrast, LLM-derived networks show minimal clustering and weak centrality correlations, even when manipulating conversational memory. These systematic differences persist across environmental scenes (VVIQ-2) and sensory modalities (PSIQ), revealing fundamental disparities between human and artificial world models. Our network-based approach provides a quantitative framework for comparing internally-generated representations across cognitive agents, with implications for developing human-like imagination in artificial intelligence systems.