SPARK: Search Personalization via Agent-Driven Retrieval and Knowledge-sharing
作者: Gaurab Chhetri, Subasish Das, Tausif Islam Chowdhury
分类: cs.AI
发布日期: 2025-12-30
备注: This is the author's preprint. Accepted to WEB&GRAPH 2026 (co-located with WSDM 2026), Boise, Idaho, USA, Feb 26, 2026. Final version will appear in WSDM 2026 Companion Proceedings. Conf: https://wsdm-conference.org/2026/ Workshop: https://aiimlab.org/events/WSDM_2026_WEB_and_GRAPH_2026_Workshop_on_Web_and_Graphs_Responsible_Intelligence_and_Social_Media.html
💡 一句话要点
SPARK:通过Agent驱动的检索和知识共享实现搜索个性化
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 个性化搜索 多Agent系统 大型语言模型 检索增强生成 知识共享
📋 核心要点
- 现有搜索系统难以有效建模用户不断变化的多维度信息需求,静态用户画像和单体检索流程存在局限性。
- SPARK框架利用基于角色的LLM Agent进行协同检索和知识共享,实现涌现式个性化搜索。
- SPARK框架通过Agent间的协作,以及自适应学习机制,提升了搜索的协调效率和个性化质量。
📝 摘要(中文)
个性化搜索需要能够建模用户不断演变的多维度信息需求,这对受限于静态用户画像或单体检索流程的系统提出了挑战。我们提出了SPARK(Search Personalization via Agent-Driven Retrieval and Knowledge-sharing),一个框架,其中协同的、基于角色的大型语言模型(LLM)Agent提供特定任务的检索和涌现式个性化。SPARK形式化了一个由角色、专业知识、任务上下文和领域定义的角色空间,并引入了一个Persona Coordinator,它动态地解释传入的查询以激活最相关的专业Agent。每个Agent执行独立的检索增强生成过程,由专用的长短期记忆存储和上下文感知推理模块支持。通过结构化的通信协议促进Agent间的协作,包括共享记忆库、迭代辩论和接力式知识转移。SPARK借鉴了认知架构、多Agent协调理论和信息检索的原理,模拟了涌现式个性化属性如何从受最小协调规则约束的分布式Agent行为中产生。该框架产生了关于协调效率、个性化质量和认知负荷分布的可测试预测,同时结合了用于持续角色优化的自适应学习机制。通过将细粒度的Agent专业化与协同检索相结合,SPARK为下一代能够捕捉人类信息寻求行为的复杂性、流动性和上下文敏感性的搜索系统提供了见解。
🔬 方法详解
问题定义:论文旨在解决个性化搜索中,现有方法无法有效捕捉用户动态、多维信息需求的问题。传统方法依赖静态用户画像或单体检索流程,难以适应用户需求的复杂性和变化性。这些方法在处理上下文敏感的信息需求时表现不足,导致搜索结果的相关性和个性化程度较低。
核心思路:论文的核心思路是利用多Agent系统模拟人类的认知过程,通过Agent间的协作和知识共享,实现涌现式个性化。每个Agent代表一个特定的角色或专业领域,能够根据任务上下文进行独立检索和推理。通过Persona Coordinator动态激活相关Agent,并利用结构化的通信协议促进Agent间的协作,从而实现更精准、更个性化的搜索结果。
技术框架:SPARK框架包含以下主要模块:Persona Space(角色空间,定义Agent的角色、专业知识等)、Persona Coordinator(动态激活相关Agent)、Specialized Agents(执行检索增强生成过程)、Long- and Short-Term Memory Stores(存储Agent的知识和上下文信息)、Context-Aware Reasoning Modules(支持Agent进行上下文推理)、Communication Protocols(促进Agent间的协作,如共享记忆库、迭代辩论等)。整体流程是:用户输入查询,Persona Coordinator根据查询激活相关Agent,Agent执行检索增强生成,Agent间通过通信协议进行协作,最终生成个性化搜索结果。
关键创新:SPARK的关键创新在于将多Agent系统应用于个性化搜索,并引入了角色空间的概念。通过Agent的专业化和协作,实现了涌现式个性化,能够更好地捕捉用户动态、多维的信息需求。与传统方法相比,SPARK能够更好地处理上下文敏感的信息需求,并提供更精准、更个性化的搜索结果。
关键设计:论文中关键的设计包括:角色空间的定义,如何根据查询激活相关Agent,Agent间的通信协议,以及Agent的检索增强生成过程。具体的参数设置、损失函数、网络结构等技术细节在论文中可能没有详细描述,属于未知信息。
🖼️ 关键图片
📊 实验亮点
论文通过实验验证了SPARK框架的有效性,但具体的性能数据、对比基线、提升幅度等信息在摘要中未提及,属于未知信息。摘要中提到该框架产生了关于协调效率、个性化质量和认知负荷分布的可测试预测,表明实验可能涉及这些方面的评估。
🎯 应用场景
SPARK框架可应用于各种需要个性化搜索的场景,如电商推荐、知识库检索、智能助手等。该研究的实际价值在于提升搜索结果的相关性和用户满意度,未来可能影响下一代搜索引擎的设计,使其更智能、更个性化,更好地满足用户的信息需求。
📄 摘要(原文)
Personalized search demands the ability to model users' evolving, multi-dimensional information needs; a challenge for systems constrained by static profiles or monolithic retrieval pipelines. We present SPARK (Search Personalization via Agent-Driven Retrieval and Knowledge-sharing), a framework in which coordinated persona-based large language model (LLM) agents deliver task-specific retrieval and emergent personalization. SPARK formalizes a persona space defined by role, expertise, task context, and domain, and introduces a Persona Coordinator that dynamically interprets incoming queries to activate the most relevant specialized agents. Each agent executes an independent retrieval-augmented generation process, supported by dedicated long- and short-term memory stores and context-aware reasoning modules. Inter-agent collaboration is facilitated through structured communication protocols, including shared memory repositories, iterative debate, and relay-style knowledge transfer. Drawing on principles from cognitive architectures, multi-agent coordination theory, and information retrieval, SPARK models how emergent personalization properties arise from distributed agent behaviors governed by minimal coordination rules. The framework yields testable predictions regarding coordination efficiency, personalization quality, and cognitive load distribution, while incorporating adaptive learning mechanisms for continuous persona refinement. By integrating fine-grained agent specialization with cooperative retrieval, SPARK provides insights for next-generation search systems capable of capturing the complexity, fluidity, and context sensitivity of human information-seeking behavior.