Generative Retrieval with Preference Optimization for E-commerce Search
作者: Mingming Li, Huimu Wang, Zuxu Chen, Guangtao Nie, Yiming Qiu, Guoyu Tang, Lin Liu, Jingwei Zhuo
分类: cs.IR, cs.AI
发布日期: 2024-07-29 (更新: 2024-10-25)
💡 一句话要点
提出基于偏好优化的生成式检索框架,解决电商搜索中生成式检索的挑战。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 生成式检索 电商搜索 偏好优化 多跨度标识符 约束波束搜索
📋 核心要点
- 电商搜索中,生成式检索面临商品标题生成复杂、噪声干扰、长尾查询和可解释性差等挑战。
- 提出基于偏好优化的生成式检索框架,通过多跨度标识符和约束波束搜索简化生成过程。
- 实验表明,该框架在真实数据集上表现出竞争力,并通过在线A/B测试验证了其有效性。
📝 摘要(中文)
生成式检索通过直接生成相关文档的标识符来响应特定查询,为文档检索引入了一种突破性的范例。这种范例在大语言模型的背景下,在表示和泛化能力方面表现出显著的优势和潜力。然而,在电商搜索场景中,它面临着重大挑战,包括从简短查询生成详细商品标题的复杂性、带有微弱语言顺序的商品标题中的噪声、长尾查询问题以及结果的可解释性。为了应对这些挑战,我们开发了一种创新的电商搜索框架,称为基于偏好优化的生成式检索。该框架旨在有效地学习和对齐自回归模型与目标数据,随后通过基于约束的波束搜索生成最终商品。通过采用多跨度标识符来表示原始商品标题,并将从查询生成标题的任务转化为从查询生成多跨度标识符的任务,我们旨在简化生成过程。该框架进一步利用点击数据与人类偏好对齐,并采用约束搜索方法来识别用于检索最终商品的关键跨度,从而提高结果的可解释性。我们的大量实验表明,该框架在真实世界的数据集上取得了具有竞争力的性能,在线 A/B 测试证明了其在提高转化率方面的优越性和有效性。
🔬 方法详解
问题定义:论文旨在解决电商搜索中生成式检索所面临的挑战。现有方法在处理简短查询生成详细商品标题、商品标题噪声、长尾查询以及结果可解释性方面存在不足。这些问题导致检索效果不佳,用户体验下降。
核心思路:论文的核心思路是将商品标题的生成任务转化为多跨度标识符的生成任务,从而简化生成过程。同时,利用点击数据对模型进行偏好优化,使其更好地对齐人类偏好。此外,采用约束波束搜索来提高结果的可解释性。这样设计的目的是为了提高生成式检索在电商搜索场景下的准确性和效率。
技术框架:该框架主要包含以下几个模块:1) 多跨度标识符生成模块:将原始商品标题表示为多跨度标识符,简化生成目标。2) 自回归模型:学习查询与多跨度标识符之间的关系。3) 偏好优化模块:利用点击数据对模型进行优化,使其更好地对齐人类偏好。4) 约束波束搜索模块:在生成过程中施加约束,提高结果的可解释性。整体流程是:用户输入查询,模型生成多跨度标识符,然后通过约束波束搜索检索最终商品。
关键创新:最重要的技术创新点在于将商品标题生成转化为多跨度标识符生成。与直接生成商品标题相比,生成多跨度标识符可以有效降低生成难度,提高生成效率。此外,结合偏好优化和约束波束搜索,进一步提高了检索的准确性和可解释性。
关键设计:论文中关键的设计包括:1) 多跨度标识符的构建方式:如何将原始商品标题有效地表示为多跨度标识符。2) 偏好优化损失函数的设计:如何利用点击数据来优化模型,使其更好地对齐人类偏好。3) 约束波束搜索的约束条件:如何设计约束条件,以提高结果的可解释性。这些设计细节直接影响着框架的性能。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该框架在真实数据集上取得了具有竞争力的性能。在线A/B测试结果显示,该框架能够显著提高商品转化率,证明了其在实际应用中的有效性。具体性能数据(例如CTR、GMV提升百分比)未知,但整体效果优于现有方法。
🎯 应用场景
该研究成果可应用于电商平台的搜索系统,提高商品检索的准确性和效率,改善用户搜索体验,提升商品转化率。此外,该方法也可以推广到其他需要生成式检索的场景,例如问答系统、知识图谱检索等,具有广泛的应用前景。
📄 摘要(原文)
Generative retrieval introduces a groundbreaking paradigm to document retrieval by directly generating the identifier of a pertinent document in response to a specific query. This paradigm has demonstrated considerable benefits and potential, particularly in representation and generalization capabilities, within the context of large language models. However, it faces significant challenges in E-commerce search scenarios, including the complexity of generating detailed item titles from brief queries, the presence of noise in item titles with weak language order, issues with long-tail queries, and the interpretability of results. To address these challenges, we have developed an innovative framework for E-commerce search, called generative retrieval with preference optimization. This framework is designed to effectively learn and align an autoregressive model with target data, subsequently generating the final item through constraint-based beam search. By employing multi-span identifiers to represent raw item titles and transforming the task of generating titles from queries into the task of generating multi-span identifiers from queries, we aim to simplify the generation process. The framework further aligns with human preferences using click data and employs a constrained search method to identify key spans for retrieving the final item, thereby enhancing result interpretability. Our extensive experiments show that this framework achieves competitive performance on a real-world dataset, and online A/B tests demonstrate the superiority and effectiveness in improving conversion gains.