Quantifying the cross-linguistic effects of syncretism on agreement attraction

📄 arXiv: 2605.21403v1 📥 PDF

作者: Utku Turk, Eva Neu

分类: cs.CL

发布日期: 2026-05-20

备注: SCiL Conference Paper


💡 一句话要点

利用大型语言模型量化形态同音异义对一致性吸引的跨语言影响

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 一致性吸引 形态同音异义 大型语言模型 困惑度 注意力熵

📋 核心要点

  1. 现有研究缺乏对形态同音异义如何影响不同语言一致性吸引错误的系统解释。
  2. 本文利用大型语言模型(LLM)的困惑度和注意力熵作为处理代理,量化同音异义对一致性吸引的跨语言影响。
  3. 实验结果表明,LLM导出的指标能够重现部分语言的行为发现,并与另一些语言的零结果相符。

📝 摘要(中文)

一致性吸引错误是指动词错误地与中间名词而非其语法主语保持一致。这种错误在某些语言(英语、德语、俄语)中因形态同音异义而放大,但在其他语言(土耳其语、亚美尼亚语)中则不然。本文旨在对这种缺乏原则性解释的跨语言模式进行研究。我们使用来自大型语言模型的困惑度和注意力熵作为处理代理,来研究四种语言的这种差异。由LLM导出的度量指标重现了英语和德语的行为发现(同音异义调节吸引),与土耳其语的零结果(无调节)一致,并部分捕捉了俄语模式。我们讨论了进一步的方向,以更好地理解为什么同音异义对不同语言的一致性吸引产生不同的影响。

🔬 方法详解

问题定义:论文旨在解决形态同音异义(syncretism)如何影响不同语言中一致性吸引(agreement attraction)错误的问题。现有方法缺乏对这种跨语言差异的原则性解释,即为什么同音异义在某些语言中会放大一致性吸引错误,而在另一些语言中则不然。

核心思路:论文的核心思路是利用大型语言模型(LLM)作为认知处理的代理。具体来说,使用LLM计算的困惑度(surprisal)和注意力熵(attention entropy)来模拟人类在处理一致性吸引现象时的认知负担和注意力分配。通过比较不同语言在这些指标上的差异,来解释同音异义的影响。

技术框架:整体框架包括以下几个步骤:1) 选择四种语言(英语、德语、俄语、土耳其语),这些语言在同音异义和一致性吸引方面表现出不同的模式。2) 构建包含一致性吸引结构的句子。3) 使用预训练的LLM(具体模型未知)计算每个句子的困惑度和注意力熵。4) 分析LLM指标与人类行为数据的相关性,验证LLM是否能够捕捉到同音异义对一致性吸引的影响。

关键创新:论文的关键创新在于将大型语言模型应用于语言学研究,特别是用于量化认知处理过程。通过困惑度和注意力熵这两个指标,将抽象的语言现象与可计算的数值联系起来,为跨语言比较提供了一种新的方法。与传统的基于规则或基于统计的语言模型相比,LLM能够更好地捕捉到语言的复杂性和细微差别。

关键设计:论文的关键设计包括:1) 选择合适的LLM,需要考虑模型的规模、训练数据和语言覆盖范围(具体模型未知)。2) 设计包含一致性吸引结构的句子,需要控制其他可能影响结果的因素,如句子长度和词频。3) 选择合适的困惑度和注意力熵的计算方法,需要考虑模型的内部机制和语言的特点。4) 使用统计方法分析LLM指标与人类行为数据的相关性,需要考虑样本大小和统计显著性。

📊 实验亮点

实验结果表明,LLM导出的困惑度和注意力熵能够重现英语和德语的行为发现,即同音异义会调节一致性吸引。此外,LLM指标与土耳其语的零结果一致,表明在没有同音异义的情况下,一致性吸引效应较弱。LLM指标部分捕捉了俄语的模式,表明该方法具有一定的跨语言适用性。

🎯 应用场景

该研究的潜在应用领域包括自然语言处理、计算语言学和认知科学。它可以帮助我们更好地理解人类语言处理的机制,改进语言模型的性能,并为语言教学提供理论基础。未来的影响可能包括开发更智能的语言学习工具和更自然的机器翻译系统。

📄 摘要(原文)

Agreement attraction errors, in which a verb erroneously agrees with an intervening noun rather than its grammatical head, are amplified by morphological syncretism in some languages (English, German, Russian) but not others (Turkish, Armenian), a cross-linguistic pattern without a principled account. We use surprisal and attention entropy from large language models as processing proxies to investigate this variation across four languages. LLM-derived measures replicate behavioral findings in English and German (syncretism modulates attraction), align with Turkish null results (no modulation), and partially capture Russian patterns. We discuss further directions for better understanding why syncretism affects agreement attraction differently across languages.