The Cost of Perfect English: Pragmatic Flattening and the Erasure of Authorial Voice in L2 Writing Supported by GenAI
作者: Ao Liu, Shanhua Zhu
分类: cs.CL, cs.CY
发布日期: 2026-05-13
备注: 16 pages, 2 figures
💡 一句话要点
研究揭示GenAI润色L2写作中存在的语用扁平化及作者声音的消解问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 生成式AI 二语写作 语用扁平化 作者声音 修辞身份
📋 核心要点
- 现有方法难以兼顾L2写作的语言准确性和文化语境下的语用表达,导致作者独特声音被抹去。
- 研究通过对比分析GenAI润色前后的L2写作文本,揭示了语用扁平化现象及其在互动和认知维度上的差异。
- 实验表明,GenAI在提升语言准确性的同时,会系统性地将L2作者的修辞身份改写为同质化的英美范式。
📝 摘要(中文)
本研究探讨了生成式人工智能(GenAI)在语言学习中对二语(L2)写作的影响,尤其关注“语用扁平化”现象,即文化偏好的礼貌表达和作者立场被系统性地消除。通过对比ICNALE语料库中中国B2水平大学生的议论文,并使用四个领先的大型语言模型API在零温度设置下进行润色,研究发现语义保留悖论中存在细微的“维度差异”。模型在纠正词汇语法错误和保留命题意义的同时,社会语用干预出现分歧。在互动维度上,所有模型都大幅削减了对话参与标记,将协商性语篇转变为独白式断言。在认知立场维度上,不同模型表现出基于架构的差异:一些模型积极删除了认知标记,而另一些模型则强化了试探性的对冲表达,将其作为去语境化的算法谨慎。这证实了GenAI在提高准确性的同时,会将L2作者独特的修辞身份系统性地改写为同质化的英美范式。因此,未来的教学必须超越错误纠正,提倡批判性AI素养,使多语写作者能够利用GenAI进行语言提升,同时保护社会语用多样性和修辞能动性。
🔬 方法详解
问题定义:论文旨在解决生成式AI在辅助二语写作时,可能导致的“语用扁平化”问题。现有方法(即直接使用GenAI进行润色)的痛点在于,虽然可以提高语言的流畅度和准确性,但可能会牺牲作者的个人风格、文化背景以及在特定语境下的语用表达,最终导致写作风格的同质化。
核心思路:论文的核心思路是通过对比分析GenAI润色前后的二语写作文本,量化和分析“语用扁平化”的程度和方式。通过观察GenAI对不同语用维度(如互动性和认知立场)的影响,揭示GenAI在润色过程中对作者声音的消解机制。
技术框架:研究的技术框架主要包括以下几个步骤:1) 从ICNALE语料库中选取中国B2水平大学生的议论文作为原始文本;2) 使用四个领先的大型语言模型(具体模型名称未知)的API对原始文本进行润色,设置温度为零以保证结果的可重复性;3) 对比分析润色前后的文本,关注互动维度(如对话参与标记)和认知立场维度(如认知标记)的变化;4) 分析不同模型在不同维度上的表现差异,总结GenAI对二语写作风格的影响。
关键创新:论文的关键创新在于提出了“语用扁平化”的概念,并将其与语义保留悖论联系起来,揭示了GenAI在润色二语写作时存在的潜在问题。此外,论文还区分了互动维度和认知立场维度,发现GenAI在不同维度上的表现存在差异,为更深入地理解GenAI对二语写作的影响提供了新的视角。
关键设计:论文的关键设计包括:1) 选择ICNALE语料库作为研究对象,保证了研究的代表性和可比性;2) 使用零温度设置,保证了实验结果的可重复性;3) 区分互动维度和认知立场维度,更细致地分析了GenAI的影响;4) 对比分析不同模型的表现,揭示了模型架构对润色结果的影响。具体的参数设置、损失函数、网络结构等技术细节在论文中未提及。
📊 实验亮点
研究发现,GenAI在润色L2写作时,虽然能有效纠正语法错误,但在互动维度上会大幅削减对话参与标记,将协商性语篇转变为独白式断言。在认知立场维度上,不同模型表现出差异,部分模型会积极删除认知标记,而另一些模型则会强化试探性的对冲表达。这些发现揭示了GenAI在润色过程中对作者声音的消解机制。
🎯 应用场景
该研究成果可应用于二语写作教学、AI辅助写作工具设计等领域。通过提升教师和学习者对GenAI潜在风险的认识,可以更好地利用AI工具进行语言学习,同时保护作者的个人风格和文化背景。未来的AI写作工具应更加注重语用多样性,避免过度同质化。
📄 摘要(原文)
The integration of Generative AI (GenAI) into language learning offers second language (L2) writers powerful tools for text optimization. However, pursuing native-like fluency often sacrifices sociopragmatic diversity. Investigating "pragmatic flattening" - the systematic erasure of culturally preferred politeness and authorial stance - this study conducts a comparative analysis of argumentative essays by Chinese B2-level university students from the ICNALE corpus. The original texts were polished via the APIs of four leading Large Language Models at a zero-temperature setting for reproducibility. Findings reveal a nuanced "dimensional divergence" within the Semantic Preservation Paradox. While models corrected lexicogrammatical errors and retained propositional meaning, sociopragmatic interventions were bifurcated. In the interactive dimension, all models showed a drastic collapse of dialogic engagement markers, turning negotiated discourse into monologic assertions. Conversely, in the epistemic stance dimension, models showed architecture-based variability: some aggressively scrubbed epistemic markers, while others reinforced tentative hedging as decontextualized algorithmic caution. This confirms that while GenAI enhances accuracy, it systematically overwrites L2 writers' unique rhetorical identities into a homogenized Anglo-American paradigm. We argue that future instruction must move beyond error correction, advocating for Critical AI Literacy to empower multilingual writers to use GenAI for linguistic enhancement while safeguarding sociopragmatic diversity and rhetorical agency.