WISE-Flow: Workflow-Induced Structured Experience for Self-Evolving Conversational Service Agents
作者: Yuqing Zhou, Zhuoer Wang, Jie Yuan, Hong Wang, Samson Koelle, Ziwei Zhu, Wei Niu
分类: cs.CL
发布日期: 2026-01-13
备注: 19 pages
💡 一句话要点
WISE-Flow:通过工作流诱导结构化经验,实现对话服务Agent的自我进化
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 对话服务Agent 自我进化 工作流 大型语言模型 经验学习
📋 核心要点
- 现有基于LLM的Agent在用户服务中易出错,且修复成本高昂,难以规模化,阻碍了Agent的自我进化。
- WISE-Flow通过将历史交互转化为工作流,并结合先决条件推理,使Agent能够重用经验并做出更合理的决策。
- 实验表明,WISE-Flow能够持续提升Agent在ToolSandbox和$τ^2$-bench等基准测试中的性能表现。
📝 摘要(中文)
基于大型语言模型(LLM)的Agent被广泛应用于面向用户的服务中,但在新任务中仍然容易出错,倾向于重复相同的失败模式,并且表现出显著的运行差异性。通过特定于环境的训练或手动修补来修复失败的成本高昂且难以扩展。为了在面向用户的服务环境中实现Agent的自我进化,我们提出了WISE-Flow,这是一个以工作流为中心的框架,通过诱导具有先决条件增强的动作块的工作流,将历史服务交互转换为可重用的程序化经验。在部署时,WISE-Flow将Agent的执行轨迹与检索到的工作流对齐,并执行先决条件感知的可行性推理,以实现状态接地的后续动作。在ToolSandbox和$τ^2$-bench上的实验表明,基础模型性能得到了持续提升。
🔬 方法详解
问题定义:论文旨在解决基于大型语言模型的对话服务Agent在新任务中容易出错、重复失败模式以及运行结果不稳定的问题。现有方法,如环境特定训练或手动修补,成本高昂且难以扩展,无法有效支持Agent的自我进化。
核心思路:WISE-Flow的核心思路是将历史服务交互转化为可重用的程序化经验。通过从历史交互中提取工作流,并为每个动作块添加先决条件,使得Agent在执行新任务时能够参考这些工作流,并根据当前状态判断动作的可行性,从而避免重复之前的错误。
技术框架:WISE-Flow框架主要包含以下几个模块:1) 工作流诱导模块:从历史服务交互数据中提取工作流,每个工作流由一系列具有先决条件的动作块组成。2) 工作流检索模块:根据当前任务状态,检索与当前任务最相关的工作流。3) 执行轨迹对齐模块:将Agent的执行轨迹与检索到的工作流对齐,确定下一步应该执行的动作。4) 可行性推理模块:根据当前状态和动作的先决条件,判断动作是否可行,并选择最合适的动作执行。
关键创新:WISE-Flow的关键创新在于将工作流的概念引入到对话服务Agent的自我进化中。通过工作流诱导,Agent能够从历史经验中学习,并将其应用于新的任务。此外,先决条件感知的可行性推理机制能够有效避免Agent重复之前的错误,提高其鲁棒性和可靠性。与现有方法相比,WISE-Flow无需进行大量的环境特定训练或手动修补,能够更有效地支持Agent的自我进化。
关键设计:工作流诱导模块使用序列模式挖掘算法从历史交互数据中提取频繁出现的动作序列,并将其转化为工作流。每个动作块的先决条件通过分析历史数据中动作执行前后的状态变化来确定。可行性推理模块使用逻辑推理引擎来判断动作的先决条件是否满足。具体参数设置和损失函数等技术细节在论文中未明确说明,属于未知信息。
🖼️ 关键图片
📊 实验亮点
在ToolSandbox和$τ^2$-bench基准测试中,WISE-Flow在多个基础模型上都取得了持续的性能提升。具体提升幅度和性能数据在摘要中未给出,属于未知信息。但实验结果表明,WISE-Flow能够有效提高Agent的鲁棒性和可靠性。
🎯 应用场景
WISE-Flow可应用于各种面向用户的对话服务Agent,例如智能客服、虚拟助手等。通过学习和重用历史经验,Agent能够更好地理解用户意图,提供更准确、更可靠的服务,从而提高用户满意度和降低运营成本。该研究为构建更智能、更自主的对话服务Agent提供了新的思路。
📄 摘要(原文)
Large language model (LLM)-based agents are widely deployed in user-facing services but remain error-prone in new tasks, tend to repeat the same failure patterns, and show substantial run-to-run variability. Fixing failures via environment-specific training or manual patching is costly and hard to scale. To enable self-evolving agents in user-facing service environments, we propose WISE-Flow, a workflow-centric framework that converts historical service interactions into reusable procedural experience by inducing workflows with prerequisite-augmented action blocks. At deployment, WISE-Flow aligns the agent's execution trajectory to retrieved workflows and performs prerequisite-aware feasibility reasoning to achieve state-grounded next actions. Experiments on ToolSandbox and $τ^2$-bench show consistent improvement across base models.