Large Language Models as Modal Models in Linguistics
作者: Haruto Suzuki, Saku Sugawara
分类: cs.CL
发布日期: 2026-06-09
💡 一句话要点
提出将大型语言模型视为语言学中的模态模型以促进理论研究
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 模态建模 语言学理论 语言习得 科学哲学 认知价值 解释能力
📋 核心要点
- 当前关于大型语言模型在语言学中的作用存在争议,缺乏明确的理论框架。
- 本文提出将LLMs视为模态模型,强调其在语言习得研究中的应用潜力。
- 通过分析,指出现有LLMs尚未满足作为人类语言HAEs的条件,提供新的评估视角。
📝 摘要(中文)
大型语言模型(LLMs)的快速发展引发了关于其在语言学理论中重要性的辩论。这些辩论通常分为三种立场:绝缘主义认为LLMs与人类语言无关;消除主义认为LLMs可以取代传统语言学理论;调和主义则认为LLMs是语言研究的有用工具。本文应用科学哲学中的模态建模框架,认为LLMs作为最小模型具有真实的认知价值,能够通过测试语言习得和语言能力的模态主张提供如何可能的解释(HPEs)。我们还探讨了LLMs作为人类语言的如何实际解释(HAEs)的条件,认为当前的LLMs尚未满足这些要求。基于此分析,我们提出将LLMs的解释能力理解为HPEs与HAEs之间的连续体,从而为评估LLMs在语言科学研究中的角色提供了更精确的基础。
🔬 方法详解
问题定义:本文旨在解决大型语言模型在语言学理论中的地位不明确的问题,现有方法未能有效评估LLMs的解释能力与人类语言的关系。
核心思路:论文提出将LLMs视为模态模型,强调其在提供如何可能的解释(HPEs)方面的价值,即使它们与人类认知结构没有直接对应关系。
技术框架:整体框架包括对LLMs的模态建模分析,分为HPEs与HAEs的评估,探讨LLMs在语言习得和语言能力方面的应用。
关键创新:最重要的创新点在于将LLMs的解释能力视为一个连续体,避免了对其重要性的夸大或低估,为语言学研究提供了新的评估标准。
关键设计:在分析中,采用了机制性科学解释的框架,明确了LLMs在语言研究中的应用条件与限制,强调了其作为工具的潜在价值。
🖼️ 关键图片
📊 实验亮点
研究表明,当前的LLMs在提供如何可能的解释方面具有显著的价值,但尚未满足作为人类语言的如何实际解释的标准。这一发现为未来LLMs的改进和应用提供了明确的方向。
🎯 应用场景
该研究的潜在应用领域包括语言习得研究、语言能力评估以及语言学理论的构建。通过理解LLMs的模态特性,研究者可以更有效地利用这些工具进行语言学研究,推动相关理论的发展。
📄 摘要(原文)
The rapid advancement of large language models (LLMs) has intensified debates about their significance for linguistic theory. These debates are commonly divided into three positions: insulationism, which regards LLMs as irrelevant to human language; eliminativism, which claims that LLMs can replace traditional linguistic theories; and conciliationism, which views them as useful tools for linguistic research. To clarify these positions, this paper applies the framework of modal modeling from the philosophy of science. We argue that LLMs possess genuine epistemic value as minimal models, even without structural correspondence to human cognition. In particular, they can provide how-possibly explanations (HPEs) by testing modal claims about language acquisition and linguistic competence. We then examine the conditions under which LLMs could qualify as how-actually explanations (HAEs) of human language, drawing on the mechanistic account of scientific explanation. We argue that current LLMs do not yet satisfy these requirements. On the basis of this analysis, we propose understanding the explanatory power of LLMs as lying on a continuum between HPEs and HAEs. This framework avoids both overstating and understating their explanatory significance and offers a more precise basis for evaluating the role of LLMs in the scientific study of language.