AdaptGOT: A Pre-trained Model for Adaptive Contextual POI Representation Learning

📄 arXiv: 2506.21612v1 📥 PDF

作者: Xiaobin Ren, Xinyu Zhu, Kaiqi Zhao

分类: cs.CL, cs.AI, cs.IR

发布日期: 2025-06-21


💡 一句话要点

AdaptGOT:一种用于自适应上下文POI表示学习的预训练模型

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: POI嵌入 上下文表示学习 自适应学习 地理信息 混合采样 注意力机制 MoE架构

📋 核心要点

  1. 现有POI嵌入方法缺乏有效的多上下文采样策略,对多种POI上下文的探索不足,导致通用性和泛化能力受限。
  2. AdaptGOT模型通过集成自适应表示学习和地理共现文本(GOT)表示,并结合混合采样策略,来解决上述问题。
  3. 在真实数据集上的实验表明,AdaptGOT模型在多个POI任务上表现优异,验证了其有效性。

📝 摘要(中文)

目前,在兴趣点(POI)嵌入方法方面已经取得了显著进展,这得益于推荐和分类等新型POI任务的出现。尽管特定任务的端到端模型在POI嵌入方面取得了成功,但仍然存在一些挑战。这些挑战包括:需要更有效的多上下文采样策略,对多个POI上下文的探索不足,通用性有限以及泛化能力不足。为了解决这些问题,我们提出了AdaptGOT模型,该模型集成了自适应表示学习技术和地理共现文本(GOT)表示,特别强调地理位置、共现和文本信息。AdaptGOT模型包含三个关键组件:(1)上下文邻域生成,它集成了先进的混合采样技术,如KNN、基于密度、基于重要性和类别感知策略,以捕获复杂的上下文邻域;(2)通过注意力机制增强的先进GOT表示,旨在导出高质量的定制表示并有效地捕获POI之间复杂的相互关系;(3)基于MoE的自适应编码器-解码器架构,通过最小化不同上下文中的Jensen-Shannon散度来确保拓扑一致性并丰富上下文表示。在两个真实世界数据集和多个POI任务上的实验证实了所提出的AdaptGOT模型的卓越性能。

🔬 方法详解

问题定义:现有POI嵌入方法在处理复杂上下文关系时存在不足,尤其是在多上下文采样、POI上下文探索、通用性和泛化能力方面。现有方法难以有效捕捉POI之间的复杂依赖关系,导致在推荐、分类等任务中性能受限。

核心思路:AdaptGOT的核心思路是结合自适应表示学习和地理共现文本(GOT)表示,利用混合采样策略生成更丰富的上下文邻域,并通过注意力机制增强GOT表示,从而更有效地捕捉POI之间的复杂关系。MoE架构则用于保证不同上下文表示的一致性。

技术框架:AdaptGOT模型主要包含三个模块:(1) 上下文邻域生成模块,采用KNN、基于密度、基于重要性和类别感知等混合采样策略,生成丰富的上下文邻域;(2) GOT表示增强模块,利用注意力机制增强地理位置、共现和文本信息,生成高质量的POI表示;(3) 基于MoE的自适应编码器-解码器模块,通过最小化Jensen-Shannon散度,保证不同上下文表示的拓扑一致性。

关键创新:AdaptGOT的关键创新在于:(1) 提出了混合采样策略,能够更全面地捕捉POI的上下文信息;(2) 利用注意力机制增强GOT表示,有效捕捉POI之间的复杂关系;(3) 采用MoE架构,保证了不同上下文表示的一致性。与现有方法相比,AdaptGOT能够更有效地学习POI的上下文表示,从而提升在各种POI相关任务中的性能。

关键设计:上下文邻域生成模块中,KNN采样考虑了POI的地理位置邻近性,密度采样关注高密度区域的POI,重要性采样侧重于重要POI,类别感知采样则考虑了POI的类别信息。注意力机制用于学习地理位置、共现和文本信息的重要性权重。MoE模块包含多个专家网络,每个专家网络负责处理特定类型的上下文信息。损失函数包括对比学习损失和Jensen-Shannon散度损失,前者用于学习高质量的POI表示,后者用于保证不同上下文表示的一致性。具体参数设置未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,AdaptGOT模型在两个真实世界数据集上,相比于多个基线模型,在POI推荐和分类任务中均取得了显著提升。具体性能提升数据未知,但摘要中明确指出AdaptGOT模型表现出“卓越性能”。

🎯 应用场景

AdaptGOT模型可应用于各种基于位置的服务(LBS)应用,例如POI推荐、位置预测、城市规划和交通流量预测。通过更准确地理解POI的上下文信息,可以提升推荐系统的个性化程度,优化城市资源分配,并改善交通管理效率。该模型具有广泛的应用前景,能够为智慧城市建设提供有力支持。

📄 摘要(原文)

Currently, considerable strides have been achieved in Point-of-Interest (POI) embedding methodologies, driven by the emergence of novel POI tasks like recommendation and classification. Despite the success of task-specific, end-to-end models in POI embedding, several challenges remain. These include the need for more effective multi-context sampling strategies, insufficient exploration of multiple POI contexts, limited versatility, and inadequate generalization. To address these issues, we propose the AdaptGOT model, which integrates both the (Adapt)ive representation learning technique and the Geographical-Co-Occurrence-Text (GOT) representation with a particular emphasis on Geographical location, Co-Occurrence and Textual information. The AdaptGOT model comprises three key components: (1) contextual neighborhood generation, which integrates advanced mixed sampling techniques such as KNN, density-based, importance-based, and category-aware strategies to capture complex contextual neighborhoods; (2) an advanced GOT representation enhanced by an attention mechanism, designed to derive high-quality, customized representations and efficiently capture complex interrelations between POIs; and (3) the MoE-based adaptive encoder-decoder architecture, which ensures topological consistency and enriches contextual representation by minimizing Jensen-Shannon divergence across varying contexts. Experiments on two real-world datasets and multiple POI tasks substantiate the superior performance of the proposed AdaptGOT model.