A Self-Healing Framework for Reliable LLM-Based Autonomous Agents

📄 arXiv: 2605.06737v1 📥 PDF

作者: Cheonsu Jeong, Younggun Shin

分类: cs.SE, cs.AI

发布日期: 2026-05-07

备注: 13 pages, 3 figures,1 table


💡 一句话要点

提出一种面向LLM自主智能体的自愈框架,通过故障检测与动态重规划提升系统鲁棒性。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 自主智能体 自愈框架 故障检测 鲁棒性评估 多智能体系统 自动化重规划

📋 核心要点

  1. 核心问题:LLM智能体在复杂任务中面临幻觉、执行错误及推理不一致等挑战,缺乏有效的实时监控与故障恢复机制。
  2. 方法要点:构建了包含故障检测、定量可靠性评估及动态重规划的自愈框架,通过整合内部推理与外部执行反馈实现闭环控制。
  3. 实验效果:在多智能体工作流中验证了该框架,结果显示其显著提升了任务成功率,有效降低了故障传播并增强了系统鲁棒性。

📝 摘要(中文)

基于大语言模型(LLM)的自主智能体在复杂软件系统中应用日益广泛,但幻觉、执行错误及推理不一致等不可预测的故障严重制约了其可靠性。本文提出了一种面向LLM软件智能体的可靠性感知自愈框架,集成了故障检测、可靠性评估及自动化恢复机制。首先,定义了故障类型分类法并引入定量可靠性评估模型;其次,提出基于执行模式和输出一致性的异常行为检测方法;最后,设计了通过自适应重规划和纠正性提示策略实现动态恢复的自愈机制。在多智能体工作流环境中的实验表明,该框架显著提高了任务成功率,抑制了故障传播,并增强了系统整体鲁棒性。本研究通过整合内部推理过程与外部执行结果的监控系统,为提升高级自主系统的稳定性及推动LLM在生产环境中的落地提供了重要参考。

🔬 方法详解

问题定义:论文旨在解决LLM驱动的自主智能体在复杂软件任务中因不可预测的故障(如幻觉、逻辑错误、API调用失败)导致的系统崩溃或任务失败问题,现有方法通常缺乏对智能体内部推理过程与外部执行结果的联动监控。

核心思路:引入“自愈”理念,将智能体视为一个动态系统,通过实时监控其推理逻辑与执行反馈,在检测到异常时触发自适应的重规划与纠正性提示,从而实现从故障状态向正常执行状态的自动迁移。

技术框架:框架由三个核心模块组成:1. 故障检测模块,基于执行模式分析与输出一致性校验识别异常;2. 可靠性评估模块,量化智能体当前状态的置信度;3. 自愈机制模块,利用自适应重规划策略(Adaptive Replanning)和纠正性提示(Corrective Prompting)进行动态修复。

关键创新:最大的创新在于建立了一个集成化的监控系统,该系统不仅关注外部执行结果,还深入分析智能体的内部推理过程,实现了对“推理-执行”全链路的可靠性闭环管理。

关键设计:采用了基于模式匹配的异常检测算法,并设计了针对不同故障类型的纠正性提示模板库。在重规划阶段,系统会根据评估模型的反馈,动态调整智能体的任务拆解策略,以规避已知的逻辑陷阱或执行瓶颈。

📊 实验亮点

实验在多智能体工作流环境中进行,对比基线方法,该框架在复杂任务场景下显著提升了任务成功率。实验数据表明,该方法有效抑制了故障在多智能体协作链条中的传播,在处理执行错误和逻辑幻觉方面表现出极高的鲁棒性,证明了集成化监控与自愈机制在提升LLM系统稳定性方面的显著优势。

🎯 应用场景

该框架适用于需要高可靠性的复杂软件工程场景,如自动化代码生成、多智能体协作系统、自主数据分析平台及企业级业务流程自动化。其核心价值在于降低了LLM在生产环境中的部署风险,使开发者能够构建具备自我纠错能力的鲁棒性自主系统,从而加速AI技术在工业界的落地应用。

📄 摘要(原文)

Autonomous agents based on Large Language Models (LLMs) are increasingly being utilized in complex software systems. However, reliability remains a significant challenge due to unpredictable failures such as hallucinations, execution errors, and inconsistent reasoning. This paper proposes a reliability-aware self-healing framework for LLM-based software agents. The framework integrates failure detection, reliability assessment, and automated recovery mechanisms. First, we define a taxonomy of failure types and introduce a quantitative reliability assessment model. Next, we propose a failure detection method that identifies abnormal agent behavior based on execution patterns and output consistency. Finally, we design a self-healing mechanism that dynamically recovers from failures through adaptive replanning and corrective prompting strategies. The proposed framework was implemented in a multi-agent workflow environment and evaluated using real-world task scenarios. Experimental results demonstrate that our approach significantly increases task success rates, reduces failure propagation, and enhances overall system robustness compared to existing methods. In particular, this study distinguishes itself by establishing an integrated monitoring system that combines the agent's internal reasoning process with external execution results. These findings are expected to contribute to securing the stability of advanced autonomous systems and lowering the barriers to LLM adoption in production environments.