Reason to Play: Behavioral and Brain Alignment Between Frontier LRMs and Human Game Learners

📄 arXiv: 2605.08019v1 📥 PDF

作者: Botos Csaba, Sreejan Kumar, Austin Tudor David Andrews, Laurence Hunt, Chris Summerfield, Joshua B. Tenenbaum, Rui Ponte Costa, Marcelo G. Mattar, Momchil Tomov

分类: cs.AI, q-bio.NC

发布日期: 2026-05-08

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

评估前沿大推理模型(LRMs)在复杂游戏学习中的行为与神经对齐机制

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 大推理模型 认知神经科学 计算建模 强化学习 fMRI分析 上下文学习 行为对齐

📋 核心要点

  1. 传统强化学习模型难以模拟人类在复杂、新颖环境中的快速学习与抽象规则发现能力。
  2. 研究引入大推理模型(LRMs)作为认知建模工具,通过行为数据与fMRI神经影像进行多维度对齐评估。
  3. 实验表明LRMs在行为预测和神经活动映射上显著优于传统DRL方法,揭示了上下文表征在认知对齐中的核心作用。

📝 摘要(中文)

人类在面对新环境时能迅速习得抽象知识,并灵活运用以指导高效决策。现代AI系统是否具备类似的认知能力?本研究利用包含同步fMRI记录的复杂人类游戏数据集,对比了前沿大推理模型(LRMs)、无模型/基于模型的深度强化学习(DRL)智能体以及贝叶斯理论智能体。研究发现,LRMs在游戏规则发现阶段的行为模式与人类高度一致,且在预测皮层及皮层下脑区活动方面,其表现比传统强化学习方法高出一个数量级。通过针对性操纵实验,研究进一步揭示了这种神经对齐主要源于模型对游戏状态的上下文表征,而非其后续的规划或推理过程。该成果确立了LRMs作为复杂自然环境下人类学习与决策计算模型的潜力。

🔬 方法详解

问题定义:现有深度强化学习模型在处理需要规则发现、假设修正和多步规划的复杂任务时,往往表现出与人类认知机制的显著差异,难以解释人类如何从少量样本中快速习得抽象知识。

核心思路:利用大推理模型(LRMs)强大的上下文学习能力,将其作为人类认知过程的计算代理。通过对比LRMs与人类在相同游戏任务中的行为轨迹及fMRI脑成像数据,探究AI模型是否能捕捉人类认知的神经表征。

技术框架:研究构建了一个包含复杂游戏任务的实验平台,同步采集人类玩家的行为与神经影像。模型端对比了LRMs(如GPT-4等)、传统DRL智能体及贝叶斯智能体。通过回归分析将模型内部状态映射至脑区活动,并利用置换检验(permutation controls)确保结果的稳健性。

关键创新:首次系统性地将LRMs作为人类认知神经科学的计算模型,并证明了模型对游戏状态的上下文表征(In-context representation)是实现神经对齐的关键,而非单纯的规划或推理输出。

关键设计:采用了多层面的评估指标,包括行为相似性度量、基于编码模型的神经活动预测(Encoding models),以及通过针对性操纵(Targeted manipulations)剥离模型推理与表征成分,从而精确定位神经对齐的来源。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

研究发现LRMs在预测人类脑区活动方面比传统强化学习方法高出一个数量级,且该结论在皮层和皮层下区域均具有高度稳健性。实验证明,模型对游戏状态的上下文表征是神经对齐的核心驱动力,这一发现为大模型作为认知科学研究工具提供了强有力的实证支持。

🎯 应用场景

该研究为认知神经科学提供了强大的计算建模工具,有助于理解人类在复杂环境下的学习机制。在AI领域,它为开发更具类人认知特征的通用智能体提供了理论依据,并可应用于人机协作、教育辅助系统以及神经精神疾病的计算表型分析。

📄 摘要(原文)

Humans rapidly learn abstract knowledge when encountering novel environments and flexibly deploy this knowledge to guide efficient and intelligent action. Can modern AI systems learn and plan in a similar way? We study this question using a dataset of complex human gameplay with concurrent fMRI recordings, in which participants learn novel video games that require rule discovery, hypothesis revision, and multi-step planning. We jointly evaluate models by their ability to play the games, match human learning behavior, and predict brain activity during the same task, comparing a suite of frontier Large Reasoning Models (LRMs) against model-free and model-based deep reinforcement learning agents and a Bayesian theory-based agent. We find that frontier LRMs most closely match human behavioral patterns during game discovery and predict brain activity an order of magnitude better than both reinforcement learning alternatives across cortical and subcortical regions, with effects robust to permutation controls. Through targeted manipulations, we further show that brain alignment reflects the model's in-context representation of the game state rather than its downstream planning or reasoning. Our results establish LRMs as compelling computational accounts of human learning and decision making in complex, naturalistic environments. Project page with interactive replays: https://botcs.github.io/reason-to-play/