EXACT: Explicit Attribute-Guided Decoding-Time Personalization

📄 arXiv: 2602.17695v1 📥 PDF

作者: Xin Yu, Hanwen Xing, Lingzhou Xue

分类: cs.LG, cs.AI, cs.IR

发布日期: 2026-02-06


💡 一句话要点

提出EXACT以解决个性化生成中的偏好表示问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 个性化生成 偏好建模 解码时个性化 可解释性 用户偏好

📋 核心要点

  1. 现有的解码时个性化方法依赖隐式偏好表示,缺乏可解释性,且未能适应用户偏好的动态变化。
  2. EXACT通过识别用户特定的可解释属性子集,并在推理时注入相关属性,来实现个性化生成。
  3. 实验结果表明,EXACT在偏好建模和个性化生成质量上显著优于现有强基线,提升效果明显。

📝 摘要(中文)

实现个性化对齐需要将大型语言模型适应于每个用户不断变化的上下文。尽管解码时个性化提供了可扩展的替代方案,但现有方法主要依赖于隐式、较少可解释的偏好表示,并且强加了刚性的、与上下文无关的用户表示,未能考虑偏好在不同提示中的变化。我们提出EXACT,一种新的解码时个性化方法,通过预定义的可解释属性集对有限的成对偏好反馈进行对齐。EXACT首先通过最大化离线阶段中偏好响应的可能性来识别用户特定的属性子集。然后,在在线推理中,EXACT检索与输入提示最相关的属性,并将其注入上下文以引导生成。我们在温和假设下为所提出的算法建立了理论近似保证,并证明我们的基于相似性的检索机制有效缓解了上下文偏好变化,能够适应不同任务而不汇聚冲突的偏好。大量实验表明,EXACT在偏好建模准确性和个性化生成质量上始终优于强基线。

🔬 方法详解

问题定义:本论文旨在解决个性化生成中的偏好表示问题,现有方法无法有效适应用户偏好的变化,且缺乏可解释性。

核心思路:EXACT通过离线阶段识别用户特定的可解释属性子集,并在在线推理中根据输入提示检索相关属性,从而实现个性化生成。

技术框架:EXACT的整体架构包括两个主要阶段:离线阶段用于识别用户属性,在线阶段用于根据输入提示检索并注入相关属性。

关键创新:EXACT的主要创新在于其基于相似性的检索机制,能够有效缓解上下文偏好变化,避免了汇聚冲突偏好的问题。

关键设计:在设计中,EXACT采用了最大化偏好响应可能性的策略,并在在线推理中使用语义相关性检索属性,确保生成过程的个性化和准确性。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果显示,EXACT在多个偏好数据集上均优于强基线,偏好建模准确性提升了XX%,个性化生成质量提升了YY%。这些结果表明EXACT在处理用户偏好变化方面的有效性和优势。

🎯 应用场景

EXACT的研究成果具有广泛的应用潜力,尤其在个性化对话系统、推荐系统和用户定制内容生成等领域。通过更好地理解和适应用户偏好,该方法可以提升用户体验,增加用户粘性,并推动个性化技术的发展。

📄 摘要(原文)

Achieving personalized alignment requires adapting large language models to each user's evolving context. While decoding-time personalization offers a scalable alternative to training-time methods, existing methods largely rely on implicit, less interpretable preference representations and impose a rigid, context-agnostic user representation, failing to account for how preferences shift across prompts. We introduce EXACT, a new decoding-time personalization that aligns generation with limited pairwise preference feedback using a predefined set of interpretable attributes. EXACT first identifies user-specific attribute subsets by maximizing the likelihood of preferred responses in the offline stage. Then, for online inference, EXACT retrieves the most semantically relevant attributes for an incoming prompt and injects them into the context to steer generation. We establish theoretical approximation guarantees for the proposed algorithm under mild assumptions, and provably show that our similarity-based retrieval mechanism effectively mitigates contextual preference shifts, adapting to disparate tasks without pooling conflicting preferences. Extensive experiments on human-annotated preference datasets demonstrate that EXACT consistently outperforms strong baselines, including preference modeling accuracy and personalized generation quality.