SimPersona: Learning Discrete Buyer Personas from Raw Clickstreams for Grounded E-Commerce Agents
作者: Zahra Zanjani Foumani, Alberto Castelo, Shuang Xie, Ted Chaiwachirasak, Han Li, Lingyun Wang
分类: cs.AI
发布日期: 2026-05-14 (更新: 2026-05-15)
💡 一句话要点
SimPersona:从原始点击流学习离散买家画像,用于具身电商Agent
🎯 匹配领域: 支柱四:生成式动作 (Generative Motion)
关键词: 电商Agent 买家画像 个性化推荐 VQ-VAE 点击流分析
📋 核心要点
- 现有电商Agent难以捕捉真实买家群体的多样性,常用方法依赖手工Prompt,存在脆弱、低效等问题。
- SimPersona通过行为感知的VQ-VAE从点击流中学习离散买家类型,并映射为LLM Agent的画像Token。
- 实验表明,SimPersona能有效对齐真实买家转化率,且在购物任务中优于更大参数量的基线模型。
📝 摘要(中文)
基于LLM的Web Agent可以浏览在线商店,但它们通常简化为单一的“平均买家”策略,未能捕捉到真实买家群体的异质性和分布特性。现有的个性化方法依赖于手工制作的基于Prompt的画像,这些画像脆弱、难以扩展、上下文效率低,并且无法真实地表示群体层面的行为。我们提出了SimPersona,这是一个新颖的框架,可以从历史流量中学习离散的买家类型,并将它们作为紧凑的画像Token暴露给基于LLM的Web Agent。给定原始点击流,一个行为感知的VQ-VAE诱导出一个离散的买家类型空间,该空间捕获了真实买家行为和特定商家的买家群体分布的统计结构。为了向基于LLM的Web Agent提供特定行为的指导,SimPersona将每个学习到的买家类型映射到LLM Agent词汇表中的专用画像Token,并使用这些Token在真实浏览轨迹上微调Agent。在推理时,每个合成买家都被分配到一个学习到的买家类型,只需一次编码器前向传递,无需重新训练或特定商店的Prompt工程。对于群体层面的模拟,SimPersona从每个商家在学习到的VQ-VAE码本上的经验分布中采样买家类型,并使用相应的画像Token实例化Agent,从而保留特定商家的买家群体分布。在42个保留的在线商店的837万买家上进行评估,SimPersona实现了与真实买家78%的转化率对齐,展示了不同买家类型之间可解释的行为差异,并且在面向目标的购物任务上优于参数量大8倍的基线。我们进一步发布了一个开源数据管道,该管道将原始电子商务事件日志转换为买家表示和Agent训练轨迹。
🔬 方法详解
问题定义:现有基于LLM的电商Agent通常采用“平均买家”策略,忽略了真实买家群体的异质性。现有的个性化方法依赖于手工设计的Prompt,这些Prompt难以扩展、上下文效率低,并且无法准确反映群体行为。因此,需要一种能够自动学习并有效利用买家画像的方法,以提升Agent的个性化购物能力。
核心思路:SimPersona的核心思路是从原始点击流数据中自动学习离散的买家类型,并将这些类型作为紧凑的画像Token嵌入到LLM Agent中。通过这种方式,Agent可以根据不同的买家类型采取不同的购物策略,从而更好地模拟真实买家的行为。这种方法避免了手工设计Prompt的局限性,并且能够更好地捕捉买家行为的统计结构。
技术框架:SimPersona框架主要包含两个阶段:1) 离散买家类型学习阶段:使用行为感知的VQ-VAE从原始点击流中学习离散的买家类型空间。VQ-VAE能够捕获真实买家行为和特定商家的买家群体分布的统计结构。2) Agent微调阶段:将每个学习到的买家类型映射到LLM Agent词汇表中的专用画像Token,并使用这些Token在真实浏览轨迹上微调Agent。在推理时,每个合成买家都被分配到一个学习到的买家类型,Agent根据该类型采取相应的购物策略。
关键创新:SimPersona的关键创新在于:1) 提出了一种自动学习离散买家类型的方法,避免了手工设计Prompt的局限性。2) 使用行为感知的VQ-VAE来捕获买家行为的统计结构,从而更好地模拟真实买家的行为。3) 将学习到的买家类型作为紧凑的画像Token嵌入到LLM Agent中,从而实现了高效的个性化购物。与现有方法相比,SimPersona能够更好地捕捉买家群体的异质性,并且具有更好的可扩展性和上下文效率。
关键设计:在VQ-VAE中,使用了行为感知的编码器,该编码器能够将原始点击流数据转换为买家行为的表示。VQ-VAE的码本大小是一个重要的参数,它决定了离散买家类型的数量。在Agent微调阶段,使用了对比学习损失函数,以鼓励Agent学习到不同买家类型之间的差异。此外,还使用了masking策略,以防止Agent过度拟合训练数据。
🖼️ 关键图片
📊 实验亮点
SimPersona在42个在线商店的837万买家数据上进行了评估,实现了与真实买家78%的转化率对齐。实验结果表明,SimPersona能够学习到具有可解释行为差异的买家类型,并且在面向目标的购物任务上优于参数量大8倍的基线模型。此外,该论文还开源了一个数据管道,方便研究人员复现和扩展该方法。
🎯 应用场景
SimPersona可应用于电商平台的个性化推荐、智能客服、营销活动设计等领域。通过模拟不同类型的买家行为,可以优化推荐算法,提升用户购物体验,并为商家提供更精准的营销策略。该研究有助于构建更智能、更个性化的电商生态系统,并可能扩展到其他需要用户画像的领域。
📄 摘要(原文)
LLM-based web agents can navigate live storefronts, yet they often collapse to a single "average buyer" policy, failing to capture the heterogeneous and distributional nature of real buyer populations. Existing personalization methods rely on hand-crafted prompt-based personas that are brittle, difficult to scale, context-inefficient, and unable to faithfully represent population-level behavior. We introduce SimPersona, a novel framework that learns discrete buyer types from historical traffic and exposes them to LLM-based web agents as compact persona tokens. Given raw clickstreams, a behavior-aware VQ-VAE induces a discrete buyer-type space that captures the statistical structure of real buyer behavior and merchant-specific buyer population distributions. To provide behavior-specific guidance to LLM-based web agents, SimPersona maps each learned buyer type to a dedicated persona token in the LLM agent vocabulary and fine-tunes the agent with these tokens on real browsing traces. At inference, each synthetic buyer is assigned to a learned buyer type with a single encoder forward pass, requiring no retraining or store-specific prompt engineering. For population-level simulation, SimPersona samples buyer types from each merchant's empirical distribution over the learned VQ-VAE codebook and instantiates agents with the corresponding persona tokens, preserving merchant-specific buyer population distributions. Evaluated on $8.37$M buyers across $42$ held-out live storefronts, SimPersona achieves $78\%$ conversion-rate alignment with real buyers, exhibits interpretable behavioral variation across buyer types, and outperforms a baseline with $8\times$ more parameters on goal-oriented shopping tasks. We further release an open-source data pipeline that converts raw e-commerce event logs into buyer representations and agent-training traces.