CARTS: Collaborative Agents for Recommendation Textual Summarization

📄 arXiv: 2506.17765v2 📥 PDF

作者: Jiao Chen, Kehui Yao, Reza Yousefi Maragheh, Kai Zhao, Jianpeng Xu, Jason Cho, Evren Korpeoglu, Sushant Kumar, Kannan Achan

分类: cs.IR, cs.AI

发布日期: 2025-06-21 (更新: 2025-07-01)


💡 一句话要点

CARTS:一种用于推荐文本摘要的协同Agent框架,提升标题相关性和用户参与度。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 推荐系统 文本摘要 大型语言模型 多Agent系统 协同学习

📋 核心要点

  1. 现有方法难以直接应用于推荐系统,因为推荐系统中的摘要需要高度相关于项目特征,并受字数限制。
  2. CARTS采用多Agent LLM框架,通过生成增强生成、细化循环和仲裁三个阶段,实现结构化摘要。
  3. 实验表明,CARTS在标题相关性和用户参与度方面显著优于现有基线方法,包括单次和思维链LLM。

📝 摘要(中文)

当前推荐系统通常需要某种形式的文本数据摘要,例如为产品轮播或其他分组项目展示生成简洁且连贯的标题。虽然大型语言模型在自然语言处理领域的文本摘要方面显示出潜力,但这些方法不能直接应用于推荐系统,因为在推荐系统中,解释必须与项目集的核心特征高度相关,并遵守严格的字数限制。本文提出CARTS(Collaborative Agents for Recommendation Textual Summarization),这是一个多Agent LLM框架,专为推荐系统中的结构化摘要而设计。CARTS将任务分解为三个阶段——生成增强生成(GAG)、细化循环和仲裁,其中连续的Agent角色负责提取显著的项目特征,基于相关性和长度反馈迭代地细化候选标题,并通过协同仲裁过程选择最终标题。在大型电子商务数据上的实验和实际A/B测试表明,CARTS显著优于单次和思维链LLM基线,提供更高的标题相关性和改进的用户参与度指标。

🔬 方法详解

问题定义:推荐系统需要为产品轮播等生成简洁连贯的标题,现有的大型语言模型虽然在文本摘要方面表现出色,但难以直接应用于推荐系统。主要痛点在于,生成的标题需要与推荐物品的核心特征高度相关,同时受到严格的字数限制,传统方法难以兼顾相关性和简洁性。

核心思路:CARTS的核心思路是将摘要任务分解为多个阶段,每个阶段由不同的Agent负责,协同完成摘要生成。通过这种分解,可以更好地控制摘要的相关性和长度,并利用不同Agent的优势,提升整体性能。这种多Agent协同的方式能够模拟人类专家团队合作,从而产生更优质的摘要。

技术框架:CARTS框架包含三个主要阶段:1) 生成增强生成 (GAG):负责提取显著的项目特征,为后续的标题生成提供基础。2) 细化循环:迭代地细化候选标题,基于相关性和长度反馈进行调整,确保标题既相关又简洁。3) 仲裁:通过协同仲裁过程,从多个候选标题中选择最终标题。每个阶段都由特定的Agent负责,Agent之间通过消息传递进行协作。

关键创新:CARTS的关键创新在于其多Agent协同框架,它将摘要任务分解为多个阶段,并为每个阶段设计了专门的Agent。这种分解使得可以更好地控制摘要的相关性和长度,并利用不同Agent的优势。与传统的单次或思维链LLM方法相比,CARTS能够生成更相关、更简洁的摘要。

关键设计:在GAG阶段,使用了特定的提示工程(prompt engineering)来引导LLM提取关键特征。在细化循环阶段,设计了基于相关性和长度的反馈机制,用于指导Agent迭代地改进候选标题。仲裁阶段采用了投票机制,多个Agent对候选标题进行评估,选择得分最高的标题作为最终结果。具体的参数设置和损失函数细节在论文中未明确说明,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

CARTS在大型电子商务数据上的实验和实际A/B测试中表现出色,显著优于单次和思维链LLM基线。实验结果表明,CARTS能够提供更高的标题相关性,并显著提升用户参与度指标。具体的性能提升幅度在摘要中未给出,属于未知信息。

🎯 应用场景

CARTS可应用于各种需要文本摘要的推荐系统场景,例如电商平台的产品轮播、新闻推荐的标题生成、视频推荐的摘要生成等。通过提升标题的相关性和用户参与度,CARTS可以提高推荐系统的点击率、转化率和用户满意度。未来,CARTS可以扩展到其他类型的推荐系统和文本摘要任务。

📄 摘要(原文)

Current recommendation systems often require some form of textual data summarization, such as generating concise and coherent titles for product carousels or other grouped item displays. While large language models have shown promise in NLP domains for textual summarization, these approaches do not directly apply to recommendation systems, where explanations must be highly relevant to the core features of item sets, adhere to strict word limit constraints. In this paper, we propose CARTS (Collaborative Agents for Recommendation Textual Summarization), a multi-agent LLM framework designed for structured summarization in recommendation systems. CARTS decomposes the task into three stages-Generation Augmented Generation (GAG), refinement circle, and arbitration, where successive agent roles are responsible for extracting salient item features, iteratively refining candidate titles based on relevance and length feedback, and selecting the final title through a collaborative arbitration process. Experiments on large-scale e-commerce data and live A/B testing show that CARTS significantly outperforms single-pass and chain-of-thought LLM baselines, delivering higher title relevance and improved user engagement metrics.