A Novel Hierarchical Multi-Agent System for Payments Using LLMs

📄 arXiv: 2602.24068v1 📥 PDF

作者: Joon Kiat Chua, Donghao Huang, Zhaoxia Wang

分类: cs.MA, cs.CL

发布日期: 2026-02-27

备注: 12 pages, 1 figure, 3 tables. Accepted at PAKDD 2026


💡 一句话要点

提出HMASP,首个基于LLM的多智能体支付系统,实现端到端支付工作流。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 大型语言模型 支付系统 自动化工作流 分层架构

📋 核心要点

  1. 现有LLM智能体在自动化工作流方面表现出色,但在支付任务处理上存在短板,缺乏端到端解决方案。
  2. HMASP采用分层多智能体架构,通过CPA协调,监督、路由智能体辅助,实现模块化支付任务执行。
  3. 实验结果验证了HMASP的可行性,为LLM智能体在支付领域的应用提供了新的思路和实现方案。

📝 摘要(中文)

本文提出了一种用于支付的分层多智能体系统(HMASP),旨在解决现有大型语言模型(LLM)智能体在处理支付任务方面的不足。现有智能体解决方案在实现端到端支付工作流方面面临挑战。HMASP利用开源或专有LLM,采用模块化架构,包含会话支付智能体(CPA)、监督智能体、路由智能体和流程总结智能体。CPA作为中心入口点,处理所有外部请求并协调各层级的后续任务。HMASP集成了架构模式,支持跨智能体和层级的模块化任务执行,包括共享状态变量、解耦消息状态和结构化交接协议,以促进智能体和工作流之间的协调。实验结果表明了HMASP的可行性。据我们所知,HMASP是第一个基于LLM的多智能体系统,能够实现端到端的智能体支付工作流。这项工作为将智能体能力扩展到支付领域奠定了基础。

🔬 方法详解

问题定义:现有的大型语言模型智能体,例如OpenAI的Operator和Claude的Computer Use,虽然可以自动化工作流程,但无法处理支付任务。现有的智能体解决方案在实现端到端智能体支付工作流程方面面临挑战,缺乏有效的协调和控制机制。

核心思路:本文的核心思路是构建一个分层的多智能体系统,将复杂的支付流程分解为多个模块化的任务,并分配给不同的智能体协同完成。通过分层架构和明确的职责划分,提高系统的可扩展性和可维护性。

技术框架:HMASP包含四个层级的智能体:会话支付智能体(CPA)、监督智能体、路由智能体和流程总结智能体。CPA作为系统的入口,负责接收用户请求并协调其他智能体的工作。监督智能体负责监控任务的执行情况,并在出现问题时进行干预。路由智能体负责将任务分配给合适的智能体。流程总结智能体负责总结整个支付流程的结果。

关键创新:HMASP的关键创新在于其分层多智能体架构和模块化的任务执行方式。通过将支付流程分解为多个独立的模块,可以更容易地进行扩展和定制。此外,HMASP还引入了共享状态变量、解耦消息状态和结构化交接协议等机制,以促进智能体之间的协调和通信。

关键设计:HMASP的具体实现细节未知,论文中没有详细描述关键的参数设置、损失函数、网络结构等技术细节。但可以推测,每个智能体都可能采用不同的LLM模型或微调策略,以适应其特定的任务需求。智能体之间的通信协议和任务分配策略也是关键的设计要素。

📊 实验亮点

实验结果表明,HMASP能够成功实现端到端的智能体支付工作流,验证了该方法的可行性。虽然论文中没有提供具体的性能数据或对比基线,但HMASP作为首个基于LLM的多智能体支付系统,为该领域的研究奠定了基础,并为未来的性能优化提供了方向。

🎯 应用场景

HMASP具有广泛的应用前景,可用于自动化各种支付场景,例如在线购物、账单支付、转账等。该系统可以提高支付效率,降低人工成本,并提供更便捷的用户体验。未来,HMASP还可以与其他智能体系统集成,实现更复杂的业务流程自动化。

📄 摘要(原文)

Large language model (LLM) agents, such as OpenAI's Operator and Claude's Computer Use, can automate workflows but unable to handle payment tasks. Existing agentic solutions have gained significant attention; however, even the latest approaches face challenges in implementing end-to-end agentic payment workflows. To address this gap, this research proposes the Hierarchical Multi-Agent System for Payments (HMASP), which provides an end-to-end agentic method for completing payment workflows. The proposed HMASP leverages either open-weight or proprietary LLMs and employs a modular architecture consisting of the Conversational Payment Agent (CPA - first agent level), Supervisor agents (second agent level), Routing agents (third agent level), and the Process summary agent (fourth agent level). The CPA serves as the central entry point, handling all external requests and coordinating subsequent tasks across hierarchical levels. HMASP incorporates architectural patterns that enable modular task execution across agents and levels for payment operations, including shared state variables, decoupled message states, and structured handoff protocols that facilitate coordination across agents and workflows. Experimental results demonstrate the feasibility of the proposed HMASP. To our knowledge, HMASP is the first LLM-based multi-agent system to implement end-to-end agentic payment workflows. This work lays a foundation for extending agentic capabilities into the payment domain.