L2Rec: Towards Dual-View Understanding of LLMs for Personalized Recommendation

📄 arXiv: 2605.26717v1 📥 PDF

作者: Pingjun Pan, Tingting Zhou, Peiyao Lu, Tingting Fei, Hongxiang Chen, Chuanjiang Luo

分类: cs.IR, cs.AI

发布日期: 2026-05-26

备注: Accepted at SIGIR 2026

DOI: 10.1145/3805712.3809943


💡 一句话要点

L2Rec:通过双视角理解LLM,实现个性化推荐

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 个性化推荐 大型语言模型 低秩扰动 双视角学习 混合专家模型 用户行为建模 语义理解

📋 核心要点

  1. 现有方法在融合用户行为和语义信息时,存在分布差异或缺乏端到端任务监督,限制了LLM在个性化推荐中的应用。
  2. L2Rec通过双视角个性化混合专家机制,在LLM参数层面统一行为和语义理解,实现用户特定偏好的有效建模。
  3. 实验结果表明,L2Rec在多个数据集上显著优于现有方法,并在实际工业平台上的A/B测试中验证了其有效性。

📝 摘要(中文)

为了将大型语言模型(LLM)应用于个性化推荐,需要使其通用能力与用户特定偏好对齐,并有效利用行为和语义信号。现有方法通常在输入层(例如,将行为嵌入注入到token空间)或输出层(例如,单独编码器的对比对齐)集成这些信号,存在分布差距或缺乏端到端任务监督的问题。本文提出了L2Rec,它在LLM的参数层面统一了行为和语义理解。核心思想是,同一组Transformer参数可以作为两种视角的共享媒介:通过双视角个性化混合专家(DPMoE)机制应用特定视角的个性化低秩扰动,L2Rec使单个LLM主干能够为每个用户生成互补的行为和语义适应,并最大限度地减少表示层面的错位。自适应跨视角融合模块进一步将双视角输出集成到统一的用户偏好中。在四个数据集上的实验表明,L2Rec始终优于最先进的基线,并且在大型工业平台上的在线A/B测试验证了关键参与度指标的显著改进。

🔬 方法详解

问题定义:现有基于LLM的个性化推荐方法,通常在输入或输出层面融合用户行为和语义信息。输入层面的方法(如直接嵌入行为特征)容易引入噪声,导致分布差异;输出层面的方法(如对比学习)缺乏端到端的任务监督,难以优化。因此,如何有效融合行为和语义信息,并充分利用LLM的参数化知识,是本文要解决的问题。

核心思路:L2Rec的核心思想是利用LLM的Transformer参数作为行为和语义信息的共享媒介。通过对LLM的参数进行低秩扰动,为每个用户生成个性化的行为和语义表示。这种方法避免了直接在输入或输出层面融合信息,减少了分布差异,并允许端到端的任务监督。

技术框架:L2Rec的整体框架包括以下几个主要模块:1) LLM Backbone:使用预训练的LLM作为基础模型。2) Dual-view Personalized Mixture-of-Experts (DPMoE):为每个用户生成个性化的行为和语义低秩扰动。3) Adaptive Cross-view Fusion Module:将行为和语义表示融合为统一的用户偏好。整个框架通过端到端的训练进行优化。

关键创新:L2Rec的关键创新在于其双视角个性化混合专家机制(DPMoE),它允许LLM同时学习用户的行为和语义偏好,并将其融合到统一的表示中。与现有方法相比,DPMoE能够更有效地利用LLM的参数化知识,并减少表示层面的错位。

关键设计:DPMoE模块为每个用户学习两个低秩矩阵,分别用于行为和语义视角。这些低秩矩阵被添加到LLM的Transformer参数中,以生成个性化的表示。自适应跨视角融合模块使用注意力机制来动态地融合行为和语义表示。损失函数包括推荐任务的交叉熵损失和正则化项,以防止过拟合。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

L2Rec在四个数据集上进行了实验,结果表明其始终优于最先进的基线方法。例如,在Amazon数据集上,L2Rec相对于最佳基线方法提升了5%的Recall@10。此外,在大型工业平台上的在线A/B测试表明,L2Rec显著提升了点击率、转化率等关键参与度指标。

🎯 应用场景

L2Rec具有广泛的应用前景,可以应用于电商推荐、视频推荐、新闻推荐等各种个性化推荐场景。该研究能够提升推荐系统的准确性和用户满意度,并为LLM在推荐系统中的应用提供新的思路。未来,可以进一步探索L2Rec在冷启动场景下的应用,以及如何利用L2Rec进行用户行为预测。

📄 摘要(原文)

Adapting large language models (LLMs) for personalized recommendation requires aligning their general-purpose capabilities with user-specific preferences while effectively leveraging both behavioral and semantic signals. Existing approaches typically integrate these signals at either the input level (e.g., injecting behavioral embeddings into the token space) or the output level (e.g., contrastive alignment of separate encoders), suffering from distribution gaps or lack of end-to-end task supervision. In this work, we introduce L2Rec, which unifies behavioral and semantic understanding at the parameter level of LLMs. Our key insight is that the same set of Transformer parameters can serve as a shared medium for both views: by applying view-specific, personalized low-rank perturbations via a Dual-view Personalized Mixture-of-Experts (DPMoE) mechanism, L2Rec enables a single LLM backbone to produce complementary behavioral and semantic adaptations for each user with minimal representation-level misalignment. An adaptive cross-view fusion module further integrates the dual-view outputs into a unified user preference. Experiments on four datasets show that L2Rec consistently outperforms state-of-the-art baselines, and online A/B testing on a large-scale industrial platform validates significant improvements in key engagement metrics.