The Widespread Adoption of Large Language Model-Assisted Writing Across Society

作者: Weixin Liang, Yaohui Zhang, Mihai Codreanu, Jiayu Wang, Hancheng Cao, James Zou

分类: cs.CL

发布日期: 2025-02-13 (更新: 2025-02-17)

💡 一句话要点

分析大型语言模型辅助写作在社会各领域的普及程度与应用模式

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 辅助写作 文本分析 社会影响 ChatGPT 自然语言处理 统计分析

📋 核心要点

现有研究缺乏对LLM辅助写作在社会多领域普及程度的系统性分析，难以准确评估其影响。
该研究通过分析四大领域的海量文本数据，揭示了LLM辅助写作的普及趋势和应用模式。
研究发现LLM辅助写作在各领域均有显著应用，但增长趋势已趋于稳定，可能预示着新的发展阶段。

📝 摘要（中文）

本文系统性地分析了大型语言模型（LLM）辅助写作在四个领域（消费者投诉、公司沟通、招聘信息和国际组织新闻稿）的采用模式，时间跨度从2022年1月到2024年9月。数据集包括687,241条消费者投诉、537,413篇公司新闻稿、3.043亿条招聘信息和15,919篇联合国（UN）新闻稿。研究发现，在ChatGPT于2022年11月发布后，LLM的使用量激增。到2024年末，约18%的金融消费者投诉文本似乎是LLM辅助生成的，且在各地区广泛采用，城市地区略高。公司新闻稿中，高达24%的文本可归因于LLM。在招聘信息中，小型公司中LLM辅助写作占比略低于10%，在年轻公司中更为常见。联合国新闻稿也反映了这一趋势，近14%的内容由LLM生成或修改。虽然ChatGPT发布后采用率迅速攀升，但到2024年增长似乎已趋于稳定，这反映了LLM采用的饱和或更高级模型微妙性的提高。研究表明，企业、消费者甚至国际组织在沟通方面大量依赖生成式AI的新现实已经出现。

🔬 方法详解

问题定义：论文旨在量化大型语言模型（LLM）辅助写作在社会不同领域的普及程度。现有方法难以准确识别和量化LLM生成的内容，尤其是在文本风格逐渐融合的情况下。此外，缺乏对不同领域、不同规模组织采用LLM情况的对比分析。

核心思路：论文的核心思路是通过统计分析大规模真实文本数据，识别LLM辅助写作的痕迹，并量化其在不同领域和组织中的应用比例。通过对比ChatGPT发布前后的数据变化，推断LLM的影响。

技术框架：该研究采用人口层面的统计框架，分析四个领域（消费者投诉、公司新闻稿、招聘信息、联合国新闻稿）的海量文本数据。主要流程包括：数据收集与清洗、文本特征提取、LLM辅助写作检测、统计分析与趋势评估。

关键创新：该研究的关键创新在于其大规模、多领域的实证分析，以及对LLM辅助写作普及程度的量化评估。通过对比不同领域和组织的数据，揭示了LLM应用模式的差异性。

关键设计：论文使用了一种稳健的统计方法来推断文本是否由LLM辅助生成，但具体的技术细节（如特征提取方法、分类器选择等）在摘要中未明确说明，属于未知信息。研究关注ChatGPT发布前后文本特征的变化，以此作为LLM影响的指标。

🖼️ 关键图片

📊 实验亮点

研究发现，ChatGPT发布后，LLM辅助写作在各领域迅速普及。到2024年末，金融消费者投诉文本中约18%由LLM辅助生成，公司新闻稿中高达24%，招聘信息中小公司占比近10%，联合国新闻稿中近14%。虽然增长迅速，但到2024年增长趋势已趋于稳定。

🎯 应用场景

该研究结果可应用于评估生成式AI对社会各领域的影响，为政策制定者提供参考，帮助企业了解LLM的应用趋势，并为AI伦理研究提供数据支持。此外，该研究的方法论可推广至其他生成式AI技术的应用评估。

📄 摘要（原文）

The recent advances in large language models (LLMs) attracted significant public and policymaker interest in its adoption patterns. In this paper, we systematically analyze LLM-assisted writing across four domains-consumer complaints, corporate communications, job postings, and international organization press releases-from January 2022 to September 2024. Our dataset includes 687,241 consumer complaints, 537,413 corporate press releases, 304.3 million job postings, and 15,919 United Nations (UN) press releases. Using a robust population-level statistical framework, we find that LLM usage surged following the release of ChatGPT in November 2022. By late 2024, roughly 18% of financial consumer complaint text appears to be LLM-assisted, with adoption patterns spread broadly across regions and slightly higher in urban areas. For corporate press releases, up to 24% of the text is attributable to LLMs. In job postings, LLM-assisted writing accounts for just below 10% in small firms, and is even more common among younger firms. UN press releases also reflect this trend, with nearly 14% of content being generated or modified by LLMs. Although adoption climbed rapidly post-ChatGPT, growth appears to have stabilized by 2024, reflecting either saturation in LLM adoption or increasing subtlety of more advanced models. Our study shows the emergence of a new reality in which firms, consumers and even international organizations substantially rely on generative AI for communications.

The Widespread Adoption of Large Language Model-Assisted Writing Across Society

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理