A Survey of Vibe Coding with Large Language Models

📄 arXiv: 2510.12399v2 📥 PDF

作者: Yuyao Ge, Lingrui Mei, Zenghao Duan, Tianhao Li, Yujia Zheng, Yiwei Wang, Lexin Wang, Jiayu Yao, Tianyu Liu, Yujun Cai, Baolong Bi, Fangda Guo, Jiafeng Guo, Shenghua Liu, Xueqi Cheng

分类: cs.AI

发布日期: 2025-10-14 (更新: 2025-12-21)


💡 一句话要点

对基于大语言模型的“Vibe Coding”范式进行全面综述,揭示其挑战与机遇。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Vibe Coding 大型语言模型 人机协作 软件开发 代码生成 约束马尔可夫决策过程 开发模型 上下文工程

📋 核心要点

  1. 现有方法未能充分理解和解决“Vibe Coding”范式下人机协作的挑战,导致生产力下降。
  2. 论文通过形式化“Vibe Coding”为约束马尔可夫决策过程,并提出了五种不同的开发模型分类。
  3. 分析表明,成功的“Vibe Coding”依赖于上下文工程、开发环境和人机协作模型,而不仅仅是代理能力。

📝 摘要(中文)

大型语言模型(LLM)的进步催化了一种范式转变,从代码生成辅助转变为自主编码代理,从而实现了一种名为“Vibe Coding”的新型开发方法。在这种方法中,开发者通过观察结果来验证AI生成的实现,而不是逐行理解代码。尽管这种方法具有变革潜力,但其有效性仍未得到充分探索,经验证据表明,在人机协作方面存在意想不到的生产力损失和根本性挑战。为了解决这一差距,本综述对基于大型语言模型的Vibe Coding进行了首次全面和系统的回顾,为这种变革性的开发方法建立了理论基础和实践框架。通过对1000多篇研究论文的系统分析,我们调查了整个Vibe Coding生态系统,考察了关键的基础设施组件,包括用于编码的LLM、基于LLM的编码代理、编码代理的开发环境和反馈机制。我们首先通过约束马尔可夫决策过程将Vibe Coding形式化,从而将其确立为一门正式的学科,该过程捕捉了人类开发者、软件项目和编码代理之间的动态三元关系。在此理论基础上,我们将现有实践综合为五种不同的开发模型:无约束自动化、迭代对话协作、计划驱动、测试驱动和上下文增强模型,从而提供了该领域的第一个综合分类。至关重要的是,我们的分析表明,成功的Vibe Coding不仅取决于代理的能力,还取决于系统的上下文工程、完善的开发环境以及人机协作开发模型。

🔬 方法详解

问题定义:论文旨在解决大型语言模型(LLM)驱动的“Vibe Coding”范式在软件开发中的有效性问题。现有方法主要关注LLM的代码生成能力,而忽略了人机协作、开发环境和上下文工程等关键因素,导致实际应用中出现生产力下降和协作困难等问题。

核心思路:论文的核心思路是将“Vibe Coding”形式化为一个约束马尔可夫决策过程(CMDP),以此来建模人类开发者、软件项目和编码代理之间的动态交互关系。通过这种形式化,可以更清晰地理解影响“Vibe Coding”成功的关键因素,并为后续的开发模型设计提供理论基础。

技术框架:论文首先对“Vibe Coding”生态系统进行了全面的调研,包括用于编码的LLM、基于LLM的编码代理、编码代理的开发环境和反馈机制。然后,基于调研结果,论文提出了一个CMDP框架来形式化“Vibe Coding”。最后,论文将现有的实践综合为五种不同的开发模型:无约束自动化、迭代对话协作、计划驱动、测试驱动和上下文增强模型。

关键创新:论文最重要的技术创新在于将“Vibe Coding”形式化为CMDP,这使得可以从理论上分析和优化人机协作的软件开发过程。此外,论文提出的五种开发模型分类为理解和应用“Vibe Coding”提供了实践指导。与现有方法相比,该论文更关注人机协作的整体流程,而不仅仅是LLM的代码生成能力。

关键设计:论文的关键设计包括:(1) CMDP框架中的状态空间、动作空间和奖励函数的设计,需要准确地反映人类开发者、软件项目和编码代理之间的交互关系。(2) 五种开发模型的具体实现方式,需要根据不同的应用场景和开发需求进行选择和调整。(3) 上下文工程的设计,需要有效地利用项目信息、用户反馈和代码历史等信息来提高LLM的代码生成质量。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该论文通过对1000多篇相关研究的系统分析,首次对“Vibe Coding”范式进行了全面综述,并提出了五种不同的开发模型分类。分析表明,成功的“Vibe Coding”不仅取决于代理的能力,还取决于系统的上下文工程、完善的开发环境以及人机协作开发模型。

🎯 应用场景

该研究成果可应用于各种软件开发场景,尤其是在需要快速迭代和原型设计的项目中。通过优化人机协作流程和开发环境,可以提高开发效率和软件质量。此外,该研究还可以为LLM在软件工程领域的应用提供理论指导。

📄 摘要(原文)

The advancement of large language models (LLMs) has catalyzed a paradigm shift from code generation assistance to autonomous coding agents, enabling a novel development methodology termed "Vibe Coding" where developers validate AI-generated implementations through outcome observation rather than line-by-line code comprehension. Despite its transformative potential, the effectiveness of this emergent paradigm remains under-explored, with empirical evidence revealing unexpected productivity losses and fundamental challenges in human-AI collaboration. To address this gap, this survey provides the first comprehensive and systematic review of Vibe Coding with large language models, establishing both theoretical foundations and practical frameworks for this transformative development approach. Drawing from systematic analysis of over 1000 research papers, we survey the entire vibe coding ecosystem, examining critical infrastructure components including LLMs for coding, LLM-based coding agent, development environment of coding agent, and feedback mechanisms. We first introduce Vibe Coding as a formal discipline by formalizing it through a Constrained Markov Decision Process that captures the dynamic triadic relationship among human developers, software projects, and coding agents. Building upon this theoretical foundation, we then synthesize existing practices into five distinct development models: Unconstrained Automation, Iterative Conversational Collaboration, Planning-Driven, Test-Driven, and Context-Enhanced Models, thus providing the first comprehensive taxonomy in this domain. Critically, our analysis reveals that successful Vibe Coding depends not merely on agent capabilities but on systematic context engineering, well-established development environments, and human-agent collaborative development models.