If LLMs Have Human-Like Attributes, Then So Does Age of Empires II
作者: Adrian de Wynter
分类: cs.CL, cs.AI, cs.CY
发布日期: 2026-05-29
💡 一句话要点
质疑LLM拟人化属性:在《帝国时代II》中亦可观察到类似现象
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 拟人化属性 帝国时代II 神经网络 非唯一性
📋 核心要点
- 现有研究常将LLM拟人化,赋予其道德、理解等属性,但缺乏充分论证。
- 论文核心思想是,若LLM具有拟人化属性,则其他复杂系统(如《帝国时代II》)也可能具备。
- 通过实验和理论分析,论证了LLM的拟人化属性具有非唯一性,并提出了一种新的实验假设。
📝 摘要(中文)
大量研究关注大型语言模型(LLM)和基于LLM的智能体工作流。然而,许多研究声称LLM涌现出、归因于或假定具有广义的拟人化属性(例如,道德或对自然语言的理解)。本文的目的不是争论这些属性是否存在,而是指出这些结论可能不正确。为此,我们在电子游戏《帝国时代II》上构建并训练了一个简单的神经网络,并指出任何足够强大的基质中的实体,例如乐高或大波士顿地区,也可能呈现出这些属性。因此,LLM所谓的拟人化属性在经验上是非唯一的:虽然某些属性(例如,对提示的响应)可能保持不变,但其他属性(例如,对其感知行为的解释)可能会随着基质而改变。因此,任何基于经验的讨论都需要明确的测量标准;否则,解释将留给表征。然后,我们表明,假设这些属性存在或不存在于系统中,独立于基质并以广义的方式,会导致循环或无信息的结论,无论实验者对该主题的观点如何。最后,我们提出了一个“零”假设,即假设LLM的非唯一性,而不是假设拟人化属性来设置实验,并给出了例子。我们还讨论了对我们工作的潜在反对意见,简要调查了该领域,并证明了《帝国时代II》在功能上和图灵上是完备的。
🔬 方法详解
问题定义:现有研究倾向于将LLM拟人化,赋予其人类般的属性,例如理解能力、道德观等。然而,这些属性的涌现和存在缺乏严格的定义和验证,并且忽略了LLM运行的底层基质的影响。这种拟人化的假设可能导致对LLM行为的误解和不准确的评估。
核心思路:论文的核心思路是,如果LLM真的具有人类般的属性,那么在其他足够复杂的系统中,也应该能够观察到类似的现象。通过在《帝国时代II》中构建和训练神经网络,模拟LLM的行为,并观察是否也能涌现出类似的“拟人化”属性。这种思路旨在挑战LLM拟人化属性的唯一性,并强调基质对系统行为的影响。
技术框架:论文构建了一个简单的神经网络,并在《帝国时代II》游戏中进行训练。具体的技术框架细节未在摘要中详细说明,但可以推测其可能包括以下模块:1) 游戏状态输入模块:将游戏状态信息(例如,单位位置、资源数量等)输入到神经网络中。2) 神经网络模型:一个简单的神经网络模型,用于学习游戏策略和行为。3) 动作输出模块:根据神经网络的输出,执行相应的游戏动作(例如,建造单位、攻击敌人等)。4) 训练模块:使用强化学习或其他方法训练神经网络,使其能够更好地完成游戏任务。
关键创新:论文的关键创新在于提出了LLM拟人化属性的非唯一性观点,并使用《帝国时代II》作为案例进行论证。这种方法挑战了现有研究中对LLM的固有假设,并强调了基质对系统行为的影响。此外,论文还提出了一个“零”假设,即假设LLM的非唯一性,而不是假设拟人化属性来设置实验,这为未来的研究提供了一种新的思路。
关键设计:摘要中没有提供关于关键设计的具体细节,例如神经网络的结构、损失函数、训练算法等。这些细节需要在论文正文中查找。但是,可以推测,关键设计可能包括:1) 如何将游戏状态信息有效地编码为神经网络的输入。2) 如何设计神经网络的结构,使其能够学习复杂的游戏策略。3) 如何选择合适的损失函数和训练算法,以提高神经网络的性能。
📊 实验亮点
论文通过在《帝国时代II》中构建神经网络,论证了LLM的拟人化属性具有非唯一性。虽然摘要中没有提供具体的性能数据,但该研究的核心价值在于其理论贡献,即挑战了现有研究中对LLM的固有假设,并提出了新的实验思路。此外,论文还证明了《帝国时代II》在功能上和图灵上是完备的。
🎯 应用场景
该研究对理解和评估人工智能系统的行为具有重要意义。它强调了在研究LLM等复杂系统时,需要更加谨慎地对待拟人化假设,并考虑底层基质的影响。该研究的成果可以应用于人工智能伦理、安全和可解释性等领域,帮助我们更好地理解和控制人工智能系统的行为。
📄 摘要(原文)
Much research has been carried out on large language models (LLMs) and LLM-powered agentic workflows. However, many works within the field state emergence of, ascribe to, or assume, generalised anthropomorphic attributes to them (e.g., morality or understanding of natural language). Our goal is not to argue in favour or against the existence of these attributes, but to point out that these conclusions could be incorrect. For this we build and train a simple neural network on the videogame Age of Empires II, and note that any entity in a sufficiently-powerful substrate, such as LEGO or the Greater Boston Area, could also present such attributes. Hence, the purported anthropomorphic attributes of LLMs are empirically non-unique: although some properties (e.g., responses to prompts) could remain constant, others, such as the interpretation of their perceived behaviour, might change with the substrate. Thus, any empirically-grounded discussion requires explicit measurement criteria; otherwise the interpretation is left to the representation. We then show that assuming that these attributes exist or not in a system, independent of the substrate and in a generalised way, leads to either circular or uninformative conclusions, regardless of the experimenter's viewpoint on the subject. Finally we propose a 'null' assumption, where one assumes LLM non-uniqueness instead of assuming anthropomorphic attributes to set up an experiment, along with examples of it. We also discuss potential objections to our work, briefly survey the field, and prove that \textit{Age of Empires II} is functionally- and Turing-complete.