Assessing Cognitive Effort in L2 Idiomatic Processing: An Eye-Tracking Dataset

作者: Eduardo Santos, Juliana Carvalho, César Rennó-Costa

分类: cs.CL, cs.AI, cs.CV

发布日期: 2026-05-06

💡 一句话要点

构建眼动追踪数据集，评估二语习得者成语理解的认知负荷

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 眼动追踪 二语习得 成语理解 认知负荷 数据集

📋 核心要点

二语学习者在理解成语时，常采用字面优先策略，导致额外的认知负荷，现有研究缺乏对此的量化分析。
本研究通过眼动追踪技术，记录不同英语水平的葡萄牙语母语者在阅读成语时的眼动数据，以此评估其认知负荷。
实验结果表明，语言能力与回溯眼动存在显著负相关，验证了数据集的有效性，并为后续研究奠定基础。

📝 摘要（中文）

本文介绍了一个眼动追踪数据集的开发和验证，该数据集旨在研究二语（L2）学习者如何处理成语表达。母语者通常直接检索成语的引申含义，而二语学习者则倾向于采用字面优先的方法，这会产生可测量的认知成本。该资源通过记录以英语为二语的葡萄牙语母语者（CEFR水平A1-C2）的眼动指标来捕捉这些成本。尽管该研究使用了入门级的60 Hz硬件（Tobii Pro Spark），但结果表明，这种采样率提供了足够的数据密度来检测阅读中的注视和回溯等宏观认知事件。初步分析通过揭示语言能力与回溯眼动之间的强负相关性来验证数据集。该数据集已集成到MIA（人类和人工智能语言处理中的成语建模）计划中，可作为评估人类处理模型以及大型语言模型与类人比喻理解对齐情况的认知基础基准。

🔬 方法详解

问题定义：论文旨在解决二语学习者在理解成语时，由于采用字面优先策略而产生的认知负荷难以量化评估的问题。现有方法缺乏对不同语言水平学习者认知过程的细致分析，难以有效建模和预测其理解能力。

核心思路：论文的核心思路是通过眼动追踪技术，捕捉二语学习者在阅读成语时的眼动行为，如注视时间、回溯次数等，以此作为认知负荷的指标。通过分析这些指标与语言水平之间的关系，可以更深入地了解二语学习者的成语理解过程。

技术框架：该研究的技术框架主要包括以下几个阶段：1) 招募不同英语水平（A1-C2）的葡萄牙语母语者作为实验对象；2) 使用Tobii Pro Spark眼动仪记录实验对象在阅读包含成语的句子时的眼动数据；3) 对眼动数据进行预处理和分析，提取注视时间、回溯次数等指标；4) 分析这些指标与语言水平之间的相关性，验证数据集的有效性。

关键创新：该研究的关键创新在于构建了一个专门用于研究二语学习者成语理解的眼动追踪数据集。该数据集包含了不同语言水平学习者的眼动数据，可以用于评估人类处理模型以及大型语言模型与类人比喻理解的对齐情况。此外，该研究还验证了使用入门级60 Hz硬件进行眼动追踪的可行性。

关键设计：该研究的关键设计包括：1) 实验材料的选择，确保包含具有代表性的成语；2) 实验流程的设计，避免干扰实验对象的阅读过程；3) 眼动数据的预处理方法，去除噪声和伪影；4) 统计分析方法的选择，确保结果的可靠性。使用了Tobii Pro Spark眼动仪，采样率为60Hz。实验对象为葡萄牙语母语者，英语水平覆盖CEFR A1-C2。

🖼️ 关键图片

📊 实验亮点

实验结果表明，语言能力与回溯眼动之间存在显著的负相关关系，即语言能力越高的学习者，在阅读成语时回溯次数越少。这一结果验证了数据集的有效性，并为后续研究提供了重要的参考依据。即使使用60Hz的入门级眼动仪，也能有效捕捉到宏观认知事件。

🎯 应用场景

该研究成果可应用于二语习得研究、自然语言处理和教育技术等领域。该数据集可作为评估人类处理模型以及大型语言模型与类人比喻理解对齐情况的基准。此外，该研究还可以为二语教学提供指导，帮助教师更好地了解学生的认知过程，并设计更有效的教学方法。

📄 摘要（原文）

This paper presents the development and validation of an eye-tracking dataset designed to investigate how second-language (L2) learners process idiomatic expressions. While native speakers often rely on direct retrieval of figurative meanings, L2 speakers frequently adopt a literal-first approach, which incurs measurable cognitive costs. This resource captures these costs through ocular metrics recorded from Portuguese L1 speakers of English across all CEFR proficiency levels (A1-C2). Although the study uses entry-level 60 Hz hardware (Tobii Pro Spark), we demonstrate that this sampling rate provides sufficient data density to detect macro-cognitive events such as fixations and regressions in reading. Preliminary analysis validates the dataset by revealing a strong inverse correlation between language proficiency and regressive eye movements. Integrated into the MIA (Modeling Idiomaticity in Human and Artificial Language Processing) initiative, this dataset serves as a cognitively grounded benchmark for evaluating both human processing models and the alignment of large language models with human-like figurative understanding.

Assessing Cognitive Effort in L2 Idiomatic Processing: An Eye-Tracking Dataset

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理