Episodic Memory in Agentic Frameworks: Suggesting Next Tasks
作者: Sandro Rama Fiorini, Leonardo G. Azevedo, Raphael M. Thiago, Valesca M. de Sousa, Anton B. Labate, Viviane Torres da Silva
分类: cs.MA, cs.AI, cs.LG
发布日期: 2025-11-21
💡 一句话要点
提出基于情景记忆的Agent框架,辅助LLM进行科研工作流任务推荐
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: Agent框架 情景记忆 大型语言模型 科学工作流 任务推荐
📋 核心要点
- 现有Agent框架依赖LLM进行任务推荐,易产生幻觉,且需大量专有数据微调。
- 提出情景记忆架构,存储和检索历史工作流,指导Agent推荐下一步任务。
- 通过匹配当前工作流与历史序列,Agent可基于历史模式推荐步骤,提升推荐质量。
📝 摘要(中文)
本文提出了一种基于大型语言模型(LLM)的Agent框架,旨在通过人机协同创作来辅助科学工作流程。一个关键挑战是如何在工作流程创建过程中推荐下一步骤,同时避免完全依赖LLM,因为这可能导致幻觉问题,并且需要使用稀缺的专有数据进行微调。为此,我们提出了一种情景记忆架构,用于存储和检索过去的工作流程,从而指导Agent推荐合理的下一步任务。通过将当前工作流程与历史序列进行匹配,Agent可以根据先前的模式推荐步骤。
🔬 方法详解
问题定义:现有基于LLM的Agent框架在科学工作流中推荐下一步任务时,面临幻觉问题,即生成不合理或不相关的建议。此外,由于缺乏足够的专有数据,对LLM进行微调以适应特定科学领域的工作流程非常困难,成本高昂。因此,需要一种方法,能够在不完全依赖LLM的情况下,为Agent提供可靠的任务推荐依据。
核心思路:本文的核心思路是利用情景记忆,即存储和检索过去成功的工作流程,作为Agent进行任务推荐的参考。通过将当前正在进行的工作流程与历史工作流程进行比较,Agent可以识别相似的模式,并基于这些模式推荐下一步可能采取的步骤。这种方法借鉴了人类的经验学习机制,避免了完全依赖LLM的生成能力,降低了幻觉风险。
技术框架:该Agent框架包含以下主要模块:1) 工作流程存储模块:用于存储历史工作流程,每个工作流程表示为一个任务序列。2) 工作流程匹配模块:将当前工作流程与存储的历史工作流程进行比较,找到最相似的序列。3) 任务推荐模块:基于匹配的历史工作流程,推荐下一步可能采取的任务。该模块可以结合LLM的生成能力,对推荐的任务进行润色和调整。
关键创新:该方法最重要的创新点在于引入了情景记忆机制,将历史工作流程作为Agent进行任务推荐的重要依据。与完全依赖LLM的方法相比,该方法能够更好地利用已有的知识和经验,降低了幻觉风险,提高了推荐的可靠性。此外,该方法不需要对LLM进行大量的微调,降低了成本。
关键设计:工作流程匹配模块可以使用多种相似度度量方法,例如编辑距离、余弦相似度等。任务推荐模块可以采用基于规则的方法,例如直接推荐匹配的历史工作流程中的下一个任务;也可以采用基于LLM的方法,例如将匹配的历史工作流程作为prompt,让LLM生成下一步任务的建议。具体的参数设置和网络结构取决于具体的应用场景和数据特点。
🖼️ 关键图片
📊 实验亮点
由于论文摘要未提供具体的实验结果,因此实验亮点未知。但可以推测,实验可能对比了基于情景记忆的Agent框架与纯LLM驱动的Agent框架在任务推荐准确率、幻觉率等指标上的表现。预期基于情景记忆的框架在推荐准确率和可靠性方面会有显著提升。
🎯 应用场景
该研究成果可应用于各种科学研究领域,例如生物信息学、化学信息学、材料科学等。通过辅助科研人员进行工作流程设计,可以提高科研效率,降低试错成本。此外,该方法还可以应用于其他领域,例如软件开发、产品设计等,为专业人员提供智能化的任务推荐服务。
📄 摘要(原文)
Agentic frameworks powered by Large Language Models (LLMs) can be useful tools in scientific workflows by enabling human-AI co-creation. A key challenge is recommending the next steps during workflow creation without relying solely on LLMs, which risk hallucination and require fine-tuning with scarce proprietary data. We propose an episodic memory architecture that stores and retrieves past workflows to guide agents in suggesting plausible next tasks. By matching current workflows with historical sequences, agents can recommend steps based on prior patterns.