Hierarchical Intent-guided Optimization with Pluggable LLM-Driven Semantics for Session-based Recommendation

📄 arXiv: 2507.04623v1 📥 PDF

作者: Jinpeng Chen, Jianxiang He, Huan Li, Senzhang Wang, Yuan Cao, Kaimin Wei, Zhenye Yang, Ye Ji

分类: cs.IR, cs.AI

发布日期: 2025-07-07

🔗 代码/项目: GITHUB


💡 一句话要点

HIPHOP:结合LLM语义与层级意图引导的会话推荐模型

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 会话推荐 大型语言模型 图神经网络 意图建模 对比学习

📋 核心要点

  1. 现有会话推荐模型忽略会话间关系,且对噪声敏感,同时缺乏对物品细粒度语义信息的有效利用。
  2. HIPHOP模型利用LLM增强物品语义表示,通过图神经网络建模物品转移,并设计层级意图引导的会话间相似性学习模块。
  3. 实验结果表明,HIPHOP在多个数据集上显著优于现有方法,有效提升了推荐质量。

📝 摘要(中文)

本文提出了一种新颖的层级意图引导优化方法,结合可插拔的LLM驱动语义学习,用于会话推荐(SBR),名为HIPHOP。现有SBR模型通常只关注单会话信息,忽略会话间的关系和有价值的跨会话洞察。一些方法试图包含会话间数据,但受到噪声和不相关信息的困扰,降低了性能。此外,大多数模型依赖于物品ID的共现,忽略了丰富的语义细节,限制了它们捕捉细粒度物品特征的能力。HIPHOP首先引入一个基于大型语言模型(LLM)的可插拔嵌入模块,以生成高质量的语义表示,增强物品嵌入。其次,HIPHOP利用图神经网络(GNN)来建模物品转移关系,并结合动态多意图捕获模块来解决用户在会话中的多样化兴趣。此外,我们设计了一个层级会话间相似性学习模块,由用户意图引导,以捕获全局和局部会话关系,有效地探索用户的长期和短期兴趣。为了减轻噪声,在会话间学习期间应用了意图引导的去噪策略。最后,我们通过使用对比学习来优化会话表示,从而增强模型的区分能力。在多个数据集上的实验表明,HIPHOP明显优于现有方法,证明了其在提高推荐质量方面的有效性。

🔬 方法详解

问题定义:会话推荐旨在根据匿名会话中的用户交互序列预测用户接下来可能交互的物品。现有方法主要痛点在于:1) 忽略了会话间的关系,无法有效利用跨会话信息;2) 容易受到噪声和不相关信息的干扰;3) 缺乏对物品语义信息的深入理解,仅依赖物品ID共现。

核心思路:HIPHOP的核心思路是利用大型语言模型(LLM)增强物品的语义表示,并通过层级结构建模用户在会话中的意图,从而更准确地捕捉用户的兴趣,并有效利用会话间的关系。通过意图引导的去噪策略,减轻噪声的影响。

技术框架:HIPHOP的整体框架包含以下几个主要模块:1) 可插拔的LLM嵌入模块:用于生成高质量的物品语义表示。2) 图神经网络(GNN)模块:用于建模会话内物品的转移关系。3) 动态多意图捕获模块:用于捕捉用户在会话中的多样化兴趣。4) 层级会话间相似性学习模块:用于捕获全局和局部会话关系,探索用户的长期和短期兴趣。5) 意图引导的去噪策略:用于减轻会话间学习中的噪声影响。6) 对比学习模块:用于增强会话表示的区分能力。

关键创新:HIPHOP的关键创新在于:1) 引入了可插拔的LLM嵌入模块,有效提升了物品语义表示的质量。2) 提出了层级会话间相似性学习模块,能够同时捕捉全局和局部会话关系,更全面地理解用户兴趣。3) 设计了意图引导的去噪策略,有效减轻了会话间学习中的噪声影响。

关键设计:HIPHOP的关键设计包括:1) LLM嵌入模块的具体选择和训练方式(论文中未明确说明,属于可插拔部分,具体实现未知)。2) 图神经网络的具体结构和参数设置(论文中未明确说明,具体实现未知)。3) 动态多意图捕获模块的实现细节,例如意图数量的确定和意图表示的生成方式(论文中未明确说明,具体实现未知)。4) 层级会话间相似性学习模块中,全局和局部相似性的计算方法和权重分配(论文中未明确说明,具体实现未知)。5) 对比学习的损失函数和负样本选择策略(论文中未明确说明,具体实现未知)。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,HIPHOP在多个数据集上显著优于现有方法,证明了其有效性。具体性能提升数据和对比基线在摘要中未明确给出,需要查阅论文原文获取详细信息。但总体而言,HIPHOP在提高推荐质量方面表现出色。

🎯 应用场景

HIPHOP模型可应用于各种在线推荐系统,例如电商、视频、音乐等平台,提升用户体验和平台收益。通过更精准地理解用户意图和利用会话间关系,HIPHOP能够提供更个性化、更相关的推荐结果,提高用户点击率、转化率和留存率。该研究对于提升推荐系统的智能化水平具有重要意义。

📄 摘要(原文)

Session-based Recommendation (SBR) aims to predict the next item a user will likely engage with, using their interaction sequence within an anonymous session. Existing SBR models often focus only on single-session information, ignoring inter-session relationships and valuable cross-session insights. Some methods try to include inter-session data but struggle with noise and irrelevant information, reducing performance. Additionally, most models rely on item ID co-occurrence and overlook rich semantic details, limiting their ability to capture fine-grained item features. To address these challenges, we propose a novel hierarchical intent-guided optimization approach with pluggable LLM-driven semantic learning for session-based recommendations, called HIPHOP. First, we introduce a pluggable embedding module based on large language models (LLMs) to generate high-quality semantic representations, enhancing item embeddings. Second, HIPHOP utilizes graph neural networks (GNNs) to model item transition relationships and incorporates a dynamic multi-intent capturing module to address users' diverse interests within a session. Additionally, we design a hierarchical inter-session similarity learning module, guided by user intent, to capture global and local session relationships, effectively exploring users' long-term and short-term interests. To mitigate noise, an intent-guided denoising strategy is applied during inter-session learning. Finally, we enhance the model's discriminative capability by using contrastive learning to optimize session representations. Experiments on multiple datasets show that HIPHOP significantly outperforms existing methods, demonstrating its effectiveness in improving recommendation quality. Our code is available: https://github.com/hjx159/HIPHOP.