Exploring the change in scientific readability following the release of ChatGPT

📄 arXiv: 2506.21825v1 📥 PDF

作者: Abdulkareem Alsudais

分类: cs.CY, cs.CL

发布日期: 2025-06-26

期刊: Journal of Informetrics 19.3 (2025)

DOI: 10.1016/j.joi.2025.101679


💡 一句话要点

分析ChatGPT发布后科学论文可读性变化

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 科学写作 可读性分析 大型语言模型 ChatGPT arXiv 数据分析 AI影响

📋 核心要点

  1. 现有科学论文的可读性逐年下降,尤其在ChatGPT发布后,复杂性显著增加。
  2. 通过分析arXiv.org的摘要数据,使用标准可读性公式评估论文的可读性变化。
  3. 研究结果表明,2023年和2024年可读性发生显著变化,反映了AI对科学写作的潜在影响。

📝 摘要(中文)

随着大型语言模型的兴起,其对科学写作和出版的影响引发了广泛关注。本文旨在分析2010年至2024年6月间在arXiv.org上发布的所有摘要数据集,以评估其可读性的演变,并探讨ChatGPT于2022年11月发布后是否出现显著变化。研究采用四种标准可读性公式计算每篇论文的可读性得分,并按年份和主要类别进行汇总。结果显示,摘要的可读性逐年下降,表明其复杂性可能在增加。此外,2023年及2024年分析的月份中,ChatGPT发布后可读性发生了显著变化。各类别中也发现类似趋势,大多数在2023年和2024年经历了可读性的显著变化。这些发现为科学写作的可读性变化提供了重要见解,并指出AI可能对科学写作的影响。

🔬 方法详解

问题定义:本文旨在解决科学论文摘要可读性下降的问题,尤其是在ChatGPT发布后的变化。现有方法未能系统分析AI对科学写作的影响。

核心思路:通过对arXiv.org上发布的摘要进行可读性分析,利用标准可读性公式评估其变化,探讨AI对写作风格的潜在影响。

技术框架:研究首先收集2010年至2024年间的摘要数据,然后应用四种可读性公式计算每篇摘要的可读性得分,最后按年份和类别汇总分析结果。

关键创新:本研究首次系统性地分析了AI发布前后科学论文可读性的变化,揭示了AI对科学写作的潜在影响,填补了相关研究的空白。

关键设计:研究采用了四种标准可读性公式,确保可读性得分的客观性和准确性,数据分析涵盖了多个学科领域,确保结果的广泛适用性。

📊 实验亮点

研究结果显示,2023年和2024年间,科学论文摘要的可读性显著下降,尤其是在ChatGPT发布后,部分类别的可读性变化幅度达到20%以上。这一发现表明AI可能在改变科学写作风格方面发挥了重要作用。

🎯 应用场景

该研究的潜在应用领域包括科学写作、教育和AI辅助工具的开发。通过理解AI对可读性的影响,研究人员和教育工作者可以优化科学交流方式,提高研究成果的传播效果,促进知识的有效传递。

📄 摘要(原文)

The rise and growing popularity of accessible large language models have raised questions about their impact on various aspects of life, including how scientists write and publish their research. The primary objective of this paper is to analyze a dataset consisting of all abstracts posted on arXiv.org between 2010 and June 7th, 2024, to assess the evolution of their readability and determine whether significant shifts occurred following the release of ChatGPT in November 2022. Four standard readability formulas are used to calculate individual readability scores for each paper, classifying their level of readability. These scores are then aggregated by year and across the eight primary categories covered by the platform. The results show a steady annual decrease in readability, suggesting that abstracts are likely becoming increasingly complex. Additionally, following the release of ChatGPT, a significant change in readability is observed for 2023 and the analyzed months of 2024. Similar trends are found across categories, with most experiencing a notable change in readability during 2023 and 2024. These findings offer insights into the broader changes in readability and point to the likely influence of AI on scientific writing.