SimPersona: Learning Discrete Buyer Personas from Raw Clickstreams for Grounded E-Commerce Agents

作者: Zahra Zanjani Foumani, Alberto Castelo, Shuang Xie, Ted Chaiwachirasak, Han Li, Lingyun Wang

分类: cs.AI

发布日期: 2026-05-14 (更新: 2026-05-15)

💡 一句话要点

SimPersona：从原始点击流学习离散买家画像，用于具身电商Agent

🎯 匹配领域: 支柱四：生成式动作 (Generative Motion)

关键词: 电商Agent 买家画像 个性化推荐 VQ-VAE 点击流分析

📋 核心要点

现有电商Agent难以捕捉真实买家群体的多样性，常用方法依赖手工Prompt，存在脆弱、低效等问题。
SimPersona通过行为感知的VQ-VAE从点击流中学习离散买家类型，并映射为LLM Agent的画像Token。
实验表明，SimPersona能有效对齐真实买家转化率，且在购物任务中优于更大参数量的基线模型。

📝 摘要（中文）

基于LLM的Web Agent可以浏览在线商店，但它们通常简化为单一的“平均买家”策略，未能捕捉到真实买家群体的异质性和分布特性。现有的个性化方法依赖于手工制作的基于Prompt的画像，这些画像脆弱、难以扩展、上下文效率低，并且无法真实地表示群体层面的行为。我们提出了SimPersona，这是一个新颖的框架，可以从历史流量中学习离散的买家类型，并将它们作为紧凑的画像Token暴露给基于LLM的Web Agent。给定原始点击流，一个行为感知的VQ-VAE诱导出一个离散的买家类型空间，该空间捕获了真实买家行为和特定商家的买家群体分布的统计结构。为了向基于LLM的Web Agent提供特定行为的指导，SimPersona将每个学习到的买家类型映射到LLM Agent词汇表中的专用画像Token，并使用这些Token在真实浏览轨迹上微调Agent。在推理时，每个合成买家都被分配到一个学习到的买家类型，只需一次编码器前向传递，无需重新训练或特定商店的Prompt工程。对于群体层面的模拟，SimPersona从每个商家在学习到的VQ-VAE码本上的经验分布中采样买家类型，并使用相应的画像Token实例化Agent，从而保留特定商家的买家群体分布。在42个保留的在线商店的837万买家上进行评估，SimPersona实现了与真实买家78%的转化率对齐，展示了不同买家类型之间可解释的行为差异，并且在面向目标的购物任务上优于参数量大8倍的基线。我们进一步发布了一个开源数据管道，该管道将原始电子商务事件日志转换为买家表示和Agent训练轨迹。

🔬 方法详解

问题定义：现有基于LLM的电商Agent通常采用“平均买家”策略，忽略了真实买家群体的异质性。现有的个性化方法依赖于手工设计的Prompt，这些Prompt难以扩展、上下文效率低，并且无法准确反映群体行为。因此，需要一种能够自动学习并有效利用买家画像的方法，以提升Agent的个性化购物能力。

核心思路：SimPersona的核心思路是从原始点击流数据中自动学习离散的买家类型，并将这些类型作为紧凑的画像Token嵌入到LLM Agent中。通过这种方式，Agent可以根据不同的买家类型采取不同的购物策略，从而更好地模拟真实买家的行为。这种方法避免了手工设计Prompt的局限性，并且能够更好地捕捉买家行为的统计结构。

技术框架：SimPersona框架主要包含两个阶段：1) 离散买家类型学习阶段：使用行为感知的VQ-VAE从原始点击流中学习离散的买家类型空间。VQ-VAE能够捕获真实买家行为和特定商家的买家群体分布的统计结构。2) Agent微调阶段：将每个学习到的买家类型映射到LLM Agent词汇表中的专用画像Token，并使用这些Token在真实浏览轨迹上微调Agent。在推理时，每个合成买家都被分配到一个学习到的买家类型，Agent根据该类型采取相应的购物策略。

关键创新：SimPersona的关键创新在于：1) 提出了一种自动学习离散买家类型的方法，避免了手工设计Prompt的局限性。2) 使用行为感知的VQ-VAE来捕获买家行为的统计结构，从而更好地模拟真实买家的行为。3) 将学习到的买家类型作为紧凑的画像Token嵌入到LLM Agent中，从而实现了高效的个性化购物。与现有方法相比，SimPersona能够更好地捕捉买家群体的异质性，并且具有更好的可扩展性和上下文效率。

关键设计：在VQ-VAE中，使用了行为感知的编码器，该编码器能够将原始点击流数据转换为买家行为的表示。VQ-VAE的码本大小是一个重要的参数，它决定了离散买家类型的数量。在Agent微调阶段，使用了对比学习损失函数，以鼓励Agent学习到不同买家类型之间的差异。此外，还使用了masking策略，以防止Agent过度拟合训练数据。

🖼️ 关键图片

📊 实验亮点

SimPersona在42个在线商店的837万买家数据上进行了评估，实现了与真实买家78%的转化率对齐。实验结果表明，SimPersona能够学习到具有可解释行为差异的买家类型，并且在面向目标的购物任务上优于参数量大8倍的基线模型。此外，该论文还开源了一个数据管道，方便研究人员复现和扩展该方法。

🎯 应用场景

SimPersona可应用于电商平台的个性化推荐、智能客服、营销活动设计等领域。通过模拟不同类型的买家行为，可以优化推荐算法，提升用户购物体验，并为商家提供更精准的营销策略。该研究有助于构建更智能、更个性化的电商生态系统，并可能扩展到其他需要用户画像的领域。

📄 摘要（原文）

LLM-based web agents can navigate live storefronts, yet they often collapse to a single "average buyer" policy, failing to capture the heterogeneous and distributional nature of real buyer populations. Existing personalization methods rely on hand-crafted prompt-based personas that are brittle, difficult to scale, context-inefficient, and unable to faithfully represent population-level behavior. We introduce SimPersona, a novel framework that learns discrete buyer types from historical traffic and exposes them to LLM-based web agents as compact persona tokens. Given raw clickstreams, a behavior-aware VQ-VAE induces a discrete buyer-type space that captures the statistical structure of real buyer behavior and merchant-specific buyer population distributions. To provide behavior-specific guidance to LLM-based web agents, SimPersona maps each learned buyer type to a dedicated persona token in the LLM agent vocabulary and fine-tunes the agent with these tokens on real browsing traces. At inference, each synthetic buyer is assigned to a learned buyer type with a single encoder forward pass, requiring no retraining or store-specific prompt engineering. For population-level simulation, SimPersona samples buyer types from each merchant's empirical distribution over the learned VQ-VAE codebook and instantiates agents with the corresponding persona tokens, preserving merchant-specific buyer population distributions. Evaluated on $8.37$M buyers across $42$ held-out live storefronts, SimPersona achieves $78\%$ conversion-rate alignment with real buyers, exhibits interpretable behavioral variation across buyer types, and outperforms a baseline with $8\times$ more parameters on goal-oriented shopping tasks. We further release an open-source data pipeline that converts raw e-commerce event logs into buyer representations and agent-training traces.

SimPersona: Learning Discrete Buyer Personas from Raw Clickstreams for Grounded E-Commerce Agents

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理