Generative Agents Navigating Digital Libraries
作者: Saber Zerhoudi, Michael Granitzer
分类: cs.IR, cs.AI, cs.DL
发布日期: 2026-02-26
期刊: Proceedings of the 26th International Conference on Asia-Pacific Digital Libraries, ICADL 2024
DOI: 10.1007/978-981-96-0865-2_14
💡 一句话要点
Agent4DL:利用生成式Agent模拟数字图书馆用户搜索行为
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 生成式Agent 数字图书馆 用户行为模拟 大语言模型 搜索行为 用户画像 信息检索
📋 核心要点
- 数字图书馆研究缺乏用户搜索数据,隐私限制了真实数据的获取,阻碍了用户行为建模。
- Agent4DL利用大语言模型生成用户画像和搜索会话,模拟用户在数字图书馆中的查询、点击等行为。
- 实验表明,Agent4DL能有效模拟真实用户行为,并在多样性和上下文感知方面优于现有模拟器SimIIR 2.0。
📝 摘要(中文)
在大语言模型快速发展的背景下,本文提出Agent4DL,一个专为数字图书馆环境设计的用户搜索行为模拟器。该模拟器旨在解决数字图书馆研究中长期存在的难题:由于隐私问题,公开可用的用户搜索模式数据集稀缺。Agent4DL能够生成逼真的用户画像和动态搜索会话,精确模仿实际的搜索策略,包括查询、点击和停止行为,并根据特定用户画像进行定制。通过与真实用户数据对比验证,Agent4DL在复制真实用户交互方面的准确性得到了证实。与现有的用户搜索模拟器(如SimIIR 2.0)相比,Agent4DL在生成更多样化和上下文感知的用户行为方面表现出更强的竞争力。
🔬 方法详解
问题定义:数字图书馆研究面临用户行为数据匮乏的挑战,由于隐私保护的限制,难以获取大规模真实用户搜索数据。现有方法,如SimIIR 2.0,在模拟用户行为的多样性和上下文感知能力方面存在不足,无法充分反映真实用户的复杂搜索模式。
核心思路:Agent4DL的核心思路是利用大语言模型(LLMs)的生成能力,构建能够模拟用户行为的智能体(Agent)。通过赋予Agent用户画像和搜索目标,使其能够自主地进行查询、点击和停止等操作,从而生成逼真的用户搜索会话。这种方法避免了直接收集用户隐私数据,同时能够灵活地模拟不同类型的用户行为。
技术框架:Agent4DL的整体框架包含以下几个主要模块:1) 用户画像生成模块:利用LLM生成具有不同背景、兴趣和知识水平的用户画像。2) 搜索会话生成模块:根据用户画像和预设的搜索目标,LLM驱动Agent进行一系列的搜索操作,包括生成查询、选择点击结果和决定何时停止搜索。3) 行为建模模块:记录Agent的搜索行为,并将其转化为可分析的数据,用于评估模拟器的性能。
关键创新:Agent4DL的关键创新在于其利用LLM进行用户行为的生成式建模。与传统的基于规则或统计模型的模拟器相比,Agent4DL能够生成更加多样化和上下文感知的用户行为。此外,Agent4DL能够根据用户画像定制搜索策略,从而更好地模拟真实用户的搜索行为。
关键设计:Agent4DL的关键设计包括:1) 使用Prompt工程来指导LLM生成高质量的用户画像和搜索会话。2) 设计合理的奖励机制,鼓励Agent探索不同的搜索策略。3) 采用多种评估指标,全面评估模拟器的性能,包括查询的相关性、点击行为的合理性和搜索会话的完整性。
🖼️ 关键图片
📊 实验亮点
Agent4DL通过与真实用户数据对比验证,证明了其在模拟用户搜索行为方面的有效性。实验结果表明,Agent4DL在生成多样化和上下文感知的用户行为方面优于现有的SimIIR 2.0模拟器。具体性能数据未知,但强调了Agent4DL在用户行为模拟方面的优势。
🎯 应用场景
Agent4DL可应用于数字图书馆的用户行为分析、搜索算法优化和个性化推荐系统开发。通过模拟不同用户的搜索行为,可以更好地理解用户需求,改进搜索系统的性能,并为用户提供更精准的推荐服务。该研究还有助于解决数据隐私问题,促进数字图书馆领域的创新。
📄 摘要(原文)
In the rapidly evolving field of digital libraries, the development of large language models (LLMs) has opened up new possibilities for simulating user behavior. This innovation addresses the longstanding challenge in digital library research: the scarcity of publicly available datasets on user search patterns due to privacy concerns. In this context, we introduce Agent4DL, a user search behavior simulator specifically designed for digital library environments. Agent4DL generates realistic user profiles and dynamic search sessions that closely mimic actual search strategies, including querying, clicking, and stopping behaviors tailored to specific user profiles. Our simulator's accuracy in replicating real user interactions has been validated through comparisons with real user data. Notably, Agent4DL demonstrates competitive performance compared to existing user search simulators such as SimIIR 2.0, particularly in its ability to generate more diverse and context-aware user behaviors.