Hierarchical Long-Term Semantic Memory for LinkedIn's Hiring Agent
作者: Zhentao Xu, Shangjing Zhang, Emir Poyraz, Yvonne Li, Ye Jin, Xie Lu, Xiaoyang Gu, Karthik Ramgopal, Praveen Kumar Bodigutla, Xiaofeng Wang
分类: cs.IR, cs.LG
发布日期: 2026-04-29
💡 一句话要点
提出层级长时语义记忆框架HLTM,提升LinkedIn招聘助手个性化能力。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 长期记忆 语义记忆 层级结构 LLM Agent 个性化推荐
📋 核心要点
- 现有LLM Agent在实际应用中缺乏有效的长期记忆机制,难以实现深度个性化和上下文感知交互。
- HLTM框架通过构建层级语义记忆树,在多粒度级别捕获语义知识,实现高效、可扩展和隐私感知的长期记忆。
- 实验表明,HLTM显著提升了LinkedIn招聘助手的答案正确性和检索F1,并优化了查询和索引延迟。
📝 摘要(中文)
大型语言模型(LLM)Agent越来越多地应用于实际产品中,其中个性化和上下文感知的用户交互至关重要。Agent长期语义记忆系统是实现这些能力的关键,它从嘈杂的纵向行为数据中提取隐式和显式信号,以结构化形式存储,并支持低延迟检索。为LLM Agent构建工业级长期记忆面临五个挑战:可扩展性、低延迟检索、隐私约束、跨领域泛化和可观察性。我们介绍了层级长时语义记忆(HLTM)框架,该框架将文本数据组织成模式对齐的记忆树,以捕获多个粒度级别的语义知识,从而实现可扩展的摄取、隐私感知的存储、低延迟检索和透明的出处。HLTM还包含一种自适应机制,以推广到不同的用例。在LinkedIn招聘助手上的大量评估表明,HLTM显著提高了答案的正确性和检索F1,提高了10%以上,同时显著推进了查询和索引延迟之间的帕累托前沿。HLTM已部署在LinkedIn的招聘助手中,为生产招聘工作流程中的核心个性化功能提供支持。
🔬 方法详解
问题定义:现有LLM Agent的长期记忆系统面临可扩展性、低延迟检索、隐私约束、跨领域泛化和可观察性等挑战。特别是在LinkedIn招聘助手这类工业级应用中,需要处理海量的用户行为数据,并快速准确地检索相关信息,同时保护用户隐私。现有方法难以同时满足这些需求。
核心思路:HLTM的核心思路是将文本数据组织成一个层级化的语义记忆树,每个节点代表不同粒度的语义知识。通过这种结构化的存储方式,可以实现高效的检索和更新,并支持隐私保护。此外,HLTM还引入了自适应机制,以适应不同的应用场景。
技术框架:HLTM框架主要包含以下几个模块:数据摄取模块,负责从原始数据中提取文本信息;语义编码模块,将文本信息编码成语义向量;层级记忆构建模块,根据语义向量构建层级语义记忆树;检索模块,根据用户查询在记忆树中进行检索;自适应模块,根据应用场景调整记忆树的结构和参数。整个流程旨在实现高效、可扩展和隐私感知的长期记忆。
关键创新:HLTM的关键创新在于其层级化的语义记忆结构。与传统的扁平化存储方式相比,层级结构可以更好地组织语义知识,提高检索效率。此外,HLTM还引入了自适应机制,可以根据不同的应用场景进行优化,提高了泛化能力。
关键设计:HLTM的具体实现细节包括:使用预训练语言模型(如BERT)进行语义编码;使用聚类算法构建层级结构;使用近似最近邻搜索(ANN)算法进行快速检索;使用差分隐私技术保护用户隐私。具体的参数设置和损失函数等细节未在论文中详细描述,属于未知信息。
🖼️ 关键图片
📊 实验亮点
在LinkedIn招聘助手上的实验表明,HLTM显著提高了答案的正确性和检索F1,提升超过10%,同时显著优化了查询和索引延迟之间的帕累托前沿。这些结果表明HLTM在实际应用中具有显著的优势。
🎯 应用场景
HLTM框架可广泛应用于需要长期记忆和个性化交互的LLM Agent,例如智能客服、推荐系统、智能助手等。在招聘领域,HLTM可以帮助招聘人员更准确地理解候选人的背景和需求,提高招聘效率和质量。该研究有望推动LLM Agent在工业界的广泛应用。
📄 摘要(原文)
Large Language Model (LLM) agents are increasingly used in real-world products, where personalized and context-aware user interactions are essential. A central enabler of such capabilities is the agent's long-term semantic memory system, which extracts implicit and explicit signals from noisy longitudinal behavioral data, stores them in a structured form, and supports low-latency retrieval. Building industrial-grade long-term memory for LLM agents raises five challenges: scalability, low-latency retrieval, privacy constraints, cross-domain generalizability, and observability. We introduce the Hierarchical Long-Term Semantic Memory (HLTM) framework, which organizes textual data into a schema-aligned memory tree that captures semantic knowledge at multiple levels of granularity, enabling scalable ingestion, privacy-aware storage, low-latency retrieval, and transparent provenance; HLTM further incorporates an adaptation mechanism to generalize across diverse use cases. Extensive evaluations on LinkedIn's Hiring Assistant show that HLTM improves answer correctness and retrieval F1 significantly by more than 10%, while significantly advancing the Pareto frontier between query and indexing latency. HLTM has been deployed in LinkedIn's Hiring Assistant to power core personalization features in production hiring workflows.