Can You Make It Sound Like You? Post-Editing LLM-Generated Text for Personal Style

📄 arXiv: 2604.24444v1 📥 PDF

作者: Connor Baumler, Calvin Bao, Huy Nghiem, Xinchen Yang, Marine Carpuat, Hal Daumé

分类: cs.CL

发布日期: 2026-04-27

备注: ACL 2026


💡 一句话要点

研究表明,用户可以通过编辑LLM生成文本,使其更贴近个人写作风格,但仍存在LLM痕迹。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 个人风格 后期编辑 人机协作 风格相似性 文本生成 风格迁移

📋 核心要点

  1. 现有方法难以保证LLM生成文本的个人风格,用户在风格敏感场景下对LLM存在顾虑。
  2. 研究探索用户通过后期编辑LLM生成文本,能否有效融入个人风格,使其更具个人特色。
  3. 实验表明,后期编辑能提升风格相似度,但编辑后文本仍保留LLM痕迹,风格多样性降低。

📝 摘要(中文)

尽管大型语言模型(LLM)在写作任务中应用日益广泛,但当个人风格至关重要时,用户可能会犹豫是否依赖LLM。对LLM生成的草稿或翻译进行后期编辑是一种常见的协作写作策略,但用户是否能有效地重塑LLM生成的文本以反映其个人风格仍不清楚。我们进行了一项预先注册的在线研究(n=81),参与者对LLM生成的草稿进行后期编辑,用于对其个人风格很重要的写作任务。使用基于嵌入的风格相似性指标,我们发现后期编辑增加了与参与者未辅助写作的风格相似性,并降低了与完全由LLM生成的输出的相似性。然而,经过后期编辑的文本在风格上仍然比参与者未辅助的对照文本更接近LLM文本,并且与未辅助的人工文本相比,风格多样性降低。我们发现感知到的风格真实性与模型测量的风格相似性之间存在差距,尽管仍然可以检测到LLM的风格痕迹,但经过后期编辑的文本通常被认为代表了参与者的个人风格。

🔬 方法详解

问题定义:论文旨在研究用户是否可以通过后期编辑LLM生成的文本,使其更贴近自己的个人写作风格。现有方法的问题在于,LLM虽然能生成流畅的文本,但在个人风格的表达上存在不足,用户难以直接使用LLM生成符合自身风格的文本。这使得用户在需要强调个人风格的写作场景中,对LLM的使用存在顾虑。

核心思路:论文的核心思路是通过实验研究用户对LLM生成文本进行后期编辑的效果。通过对比用户未辅助写作的文本、完全由LLM生成的文本以及用户编辑后的文本,分析它们在风格上的相似性,从而评估用户后期编辑在融入个人风格方面的有效性。

技术框架:该研究采用在线实验的方式,招募参与者并分配写作任务。参与者需要对LLM生成的草稿进行后期编辑,使其更符合自己的个人风格。研究使用基于嵌入的风格相似性指标来衡量不同文本之间的风格相似度。此外,研究还收集了参与者对编辑后文本风格真实性的主观评价。整体流程包括:1. 招募参与者;2. 分配写作任务;3. LLM生成草稿;4. 参与者编辑草稿;5. 收集数据(文本和主观评价);6. 分析风格相似度和主观评价。

关键创新:该研究的关键创新在于,它实证研究了用户通过后期编辑LLM生成文本来融入个人风格的有效性。以往的研究主要关注LLM生成文本的流畅性和准确性,而忽略了个人风格的重要性。该研究填补了这一空白,为理解人机协作写作中个人风格的融入提供了新的视角。

关键设计:研究使用了基于嵌入的风格相似性指标,例如计算不同文本嵌入向量之间的余弦相似度,来量化风格相似性。此外,研究还考虑了风格多样性,通过计算文本中不同风格特征的分布来衡量。在实验设计方面,研究设置了对照组(用户未辅助写作的文本)和实验组(用户编辑后的文本),以便进行对比分析。研究还收集了参与者对编辑后文本风格真实性的主观评价,以便了解用户对编辑效果的感知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,后期编辑能够增加LLM生成文本与用户个人写作风格的相似性,并降低与纯LLM生成文本的相似性。然而,编辑后的文本在风格上仍然更接近LLM文本,且风格多样性低于人工文本。此外,用户对编辑后文本的风格真实性感知与模型测量的风格相似性之间存在差距,表明用户可能高估了编辑效果。

🎯 应用场景

该研究成果可应用于个性化内容生成、人机协作写作、以及提升LLM在风格敏感场景下的应用效果。例如,可以帮助用户快速生成具有个人风格的邮件、博客文章或社交媒体内容。此外,该研究还可以为LLM的风格迁移和风格控制提供新的思路。

📄 摘要(原文)

Despite the growing use of large language models (LLMs) for writing tasks, users may hesitate to rely on LLMs when personal style is important. Post-editing LLM-generated drafts or translations is a common collaborative writing strategy, but it remains unclear whether users can effectively reshape LLM-generated text to reflect their personal style. We conduct a pre-registered online study ($n=81$) in which participants post-edit LLM-generated drafts for writing tasks where personal style matters to them. Using embedding-based style similarity metrics, we find that post-editing increases stylistic similarity to participants' unassisted writing and reduces similarity to fully LLM-generated output. However, post-edited text still remains stylistically closer in style to LLM text than to participants' unassisted control text, and it exhibits reduced stylistic diversity compared to unassisted human text. We find a gap between perceived stylistic authenticity and model-measured stylistic similarity, with post-edited text often perceived as representative of participants' personal style despite remaining detectable LLM stylistic traces.