Stop saying LLM: Large Discourse Models (LDM) and Artificial Discursive Agent (ADA)?
作者: Amar Lakel
分类: cs.CL
发布日期: 2025-12-22
备注: in French language
💡 一句话要点
提出以“大型话语模型(LDM)”和“人工话语代理(ADA)”替代“大型语言模型(LLM)”的分析框架。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 话语分析 人工智能伦理 社会文化语境 人工话语代理
📋 核心要点
- 现有对大型生成模型的分析主要集中在“大型语言模型(LLM)”的范畴,缺乏对话语本身更深层次的理解。
- 论文核心思想是将LLM重新定义为“大型话语模型(LDM)”和“人工话语代理(ADA)”,强调其在社会语境中的作用。
- 该方法旨在通过治理和共同监管,使人工话语代理在社会空间中的地位、用途和限制更加清晰,从而取代非理性的恐惧。
📝 摘要(中文)
本文提出了一种针对大型生成模型分析的认知论转变,用“大型话语模型(LDM)”取代“大型语言模型(LLM)”的范畴,进而用“人工话语代理(ADA)”取代。该理论框架基于一个本体论三元组,区分了三个调节实例:对参照世界现象规律的理解、具身认知的结构化,以及话语在社会历史背景下的结构-语言学沉积。LDM作用于这三个实例的产物(文档),对由学习语料库物化的人类经验的一部分进行话语投射建模。所提出的方案旨在用公开试验和程序取代“迷恋/恐惧”的二分法,使人工话语代理在当代社会空间中的地位、用途和限制变得可理解,并将这种方法置于国家、产业、公民社会和学术界参与的治理和共同监管的视角中。
🔬 方法详解
问题定义:当前对大型生成模型的理解主要停留在语言层面,忽略了其作为一种话语形式在社会文化语境中的复杂性。现有方法未能充分考虑模型生成内容背后的认知、历史和社会因素,导致对其潜在影响的理解不足。
核心思路:论文的核心在于将大型生成模型视为一种话语现象,即LDM和ADA。这种转变强调了模型生成的内容不仅仅是语言的组合,更是人类经验在特定社会历史语境下的投射。通过分析模型如何学习和再现这些话语,可以更好地理解其潜在的偏见、价值观和影响。
技术框架:论文并未提出具体的技术架构或流程,而是一个概念框架。该框架基于一个本体论三元组:1) 对参照世界现象规律的理解;2) 具身认知的结构化;3) 话语在社会历史背景下的结构-语言学沉积。LDM作用于这三个实例的产物(文档),对人类经验进行话语投射建模。
关键创新:该论文的创新之处在于其概念框架的转变,即从LLM到LDM和ADA。这种转变强调了大型生成模型的话语属性,并将其置于更广阔的社会文化语境中进行分析。这种视角有助于更全面地理解模型的潜在影响,并为治理和监管提供新的思路。
关键设计:由于该论文主要关注概念框架的构建,因此没有涉及具体的参数设置、损失函数或网络结构等技术细节。未来的研究可以基于此框架,探索如何将这些概念融入到模型设计和评估中。
📊 实验亮点
该论文的主要贡献在于提出了一个全新的分析框架,将大型生成模型从单纯的语言模型提升到话语模型的层面。虽然没有提供具体的实验数据,但其概念上的创新为未来的研究提供了新的方向,并强调了在人工智能发展中进行跨学科合作的重要性。
🎯 应用场景
该研究的潜在应用领域包括人工智能伦理、社会科学、传播学和政策制定。通过将大型生成模型视为话语代理,可以更好地评估其对社会价值观、文化传播和公共舆论的影响。该研究有助于制定更有效的监管措施,确保人工智能技术的可持续发展。
📄 摘要(原文)
This paper proposes an epistemological shift in the analysis of large generative models, replacing the category ''Large Language Models'' (LLM) with that of ''Large Discourse Models'' (LDM), and then with that of Artificial Discursive Agent (ADA). The theoretical framework is based on an ontological triad distinguishing three regulatory instances: the apprehension of the phenomenal regularities of the referential world, the structuring of embodied cognition, and the structural-linguistic sedimentation of the utterance within a socio-historical context. LDMs, operating on the product of these three instances (the document), model the discursive projection of a portion of human experience reified by the learning corpus. The proposed program aims to replace the ''fascination/fear'' dichotomy with public trials and procedures that make the place, uses, and limits of artificial discursive agents in contemporary social space decipherable, situating this approach within a perspective of governance and co-regulation involving the State, industry, civil society, and academia.