Review-driven Personalized Preference Reasoning with Large Language Models for Recommendation
作者: Jieyong Kim, Hyunseo Kim, Hyunjin Cho, SeongKu Kang, Buru Chang, Jinyoung Yeo, Dongha Lee
分类: cs.CL
发布日期: 2024-08-12 (更新: 2025-04-25)
备注: Accepted to SIGIR 2025
💡 一句话要点
提出EXP3RT,利用大语言模型和用户评论进行个性化偏好推理推荐
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 推荐系统 大语言模型 个性化推荐 偏好推理 可解释推荐 蒸馏学习 用户画像
📋 核心要点
- 现有方法在推荐系统中应用LLM时,受限于输入信息不足或未能充分利用LLM的推理能力。
- EXP3RT通过从用户和项目评论中提取偏好信息,并利用LLM进行个性化偏好推理,从而提升推荐效果。
- 实验结果表明,EXP3RT在评分预测和候选项目重排序方面均优于现有方法,并提高了推荐系统的可解释性。
📝 摘要(中文)
本文提出了一种基于大语言模型(LLM)的推荐系统EXP3RT,旨在充分利用用户和项目评论中丰富的偏好信息。EXP3RT通过从教师LLM蒸馏学习,执行三个关键任务:首先,从原始评论中提取和封装关键的主观偏好;其次,根据特定标准聚合和总结这些偏好,创建用户和项目画像;最后,通过考虑用户/项目画像和项目描述中的主观和客观信息,生成详细的逐步推理过程以及预测评分,即推理增强的评分预测。这种个性化的偏好推理提高了评分预测的准确性,并为推荐提供了可信和合理的解释。大量实验表明,EXP3RT在评分预测和候选项目重排序方面优于现有方法,同时显著增强了推荐系统的可解释性。
🔬 方法详解
问题定义:现有推荐系统利用大语言模型时,往往无法充分利用用户和物品评论中蕴含的丰富偏好信息,导致推荐效果受限。此外,现有方法在利用LLM进行推荐时,推理能力的使用不足,缺乏对推荐结果的有效解释。
核心思路:EXP3RT的核心思路是利用LLM从用户和物品评论中提取主观偏好,并将其整合到用户和物品画像中。通过结合主观偏好和客观信息,利用LLM进行推理,从而实现更准确的评分预测和更具解释性的推荐。
技术框架:EXP3RT的整体框架包含三个主要阶段:1) 偏好提取与封装:利用LLM从原始评论中提取关键的主观偏好信息。2) 偏好聚合与总结:根据特定标准(例如用户ID、物品ID)聚合和总结提取的偏好,创建用户和物品画像。3) 推理增强的评分预测:结合用户/物品画像和物品描述,利用LLM生成详细的逐步推理过程,并预测评分。
关键创新:EXP3RT的关键创新在于利用LLM进行个性化的偏好推理,从而提升推荐效果和可解释性。与现有方法相比,EXP3RT能够更有效地利用用户和物品评论中的信息,并提供更具说服力的推荐理由。此外,通过从教师LLM蒸馏学习,EXP3RT能够在保证性能的同时,降低计算成本。
关键设计:EXP3RT使用教师-学生模型的蒸馏学习框架。教师模型是一个预训练的大型LLM,负责生成高质量的推理过程和评分预测。学生模型(EXP3RT)通过学习教师模型的输出来提升性能。具体的损失函数包括评分预测损失和推理过程的模仿损失。此外,用户和物品画像的构建方式,以及LLM的prompt设计,也是影响EXP3RT性能的关键因素。
📊 实验亮点
实验结果表明,EXP3RT在评分预测和候选项目重排序方面均优于现有方法。例如,在某个数据集上,EXP3RT的评分预测准确率提升了X%,候选项目重排序的NDCG@K指标提升了Y%。此外,EXP3RT能够生成更具说服力的推荐理由,显著增强了推荐系统的可解释性(具体提升幅度未知)。
🎯 应用场景
EXP3RT可应用于电商、电影、音乐等多种推荐场景,通过理解用户偏好和提供可解释的推荐理由,提升用户满意度和平台转化率。该研究为未来基于LLM的推荐系统设计提供了新的思路,并有望推动个性化推荐和可解释推荐的发展。
📄 摘要(原文)
Recent advancements in Large Language Models (LLMs) have demonstrated exceptional performance across a wide range of tasks, generating significant interest in their application to recommendation systems. However, existing methods have not fully capitalized on the potential of LLMs, often constrained by limited input information or failing to fully utilize their advanced reasoning capabilities. To address these limitations, we introduce EXP3RT, a novel LLM-based recommender designed to leverage rich preference information contained in user and item reviews. EXP3RT is basically fine-tuned through distillation from a teacher LLM to perform three key tasks in order: EXP3RT first extracts and encapsulates essential subjective preferences from raw reviews, aggregates and summarizes them according to specific criteria to create user and item profiles. It then generates detailed step-by-step reasoning followed by predicted rating, i.e., reasoning-enhanced rating prediction, by considering both subjective and objective information from user/item profiles and item descriptions. This personalized preference reasoning from EXP3RT enhances rating prediction accuracy and also provides faithful and reasonable explanations for recommendation. Extensive experiments show that EXP3RT outperforms existing methods on both rating prediction and candidate item reranking for top-k recommendation, while significantly enhancing the explainability of recommendation systems.