Reasoning Over Space: Enabling Geographic Reasoning for LLM-Based Generative Next POI Recommendation

📄 arXiv: 2601.04562v1 📥 PDF

作者: Dongyi Lv, Qiuyu Ding, Heng-Da Xu, Zhaoxu Sun, Zhi Wang, Feng Xiong, Mu Xu

分类: cs.AI

发布日期: 2026-01-08


💡 一句话要点

提出ROS框架,利用地理信息增强LLM的生成式下一地点推荐能力

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 地理推荐 LLM 位置感知 链式思考 强化学习 空间语义 POI推荐

📋 核心要点

  1. 现有基于LLM的推荐系统在利用地理信息方面存在局限性,无法充分捕捉移动和本地服务场景中的空间信号。
  2. ROS框架将地理信息作为LLM推理过程中的关键决策变量,通过层级空间语义ID和移动链式思考范式来增强模型对地理信息的理解和利用。
  3. 实验结果表明,ROS在命中率方面显著优于现有方法,并提高了跨城市迁移能力,验证了其有效性。

📝 摘要(中文)

本文提出名为Reasoning Over Space (ROS) 的框架,旨在利用地理信息作为LLM推理过程中的关键决策变量,提升基于LLM的生成式推荐效果,尤其是在移动和本地服务场景下。ROS引入了层级空间语义ID (SID),将粗粒度到细粒度的位置和POI语义离散化为组合token。该框架赋予LLM一个三阶段的移动链式思考 (CoT) 范式,用于建模用户个性、构建意图对齐的候选空间,并执行基于位置信息的剪枝。此外,通过空间引导的强化学习 (RL) 使模型与真实世界地理信息对齐。在三个广泛使用的LBSN数据集上的实验表明,ROS在命中率方面比最强的基于LLM的基线方法实现了超过10%的相对收益,并提高了跨城市迁移能力,同时使用了更小的骨干模型。

🔬 方法详解

问题定义:现有基于LLM的推荐系统在地理信息利用方面存在不足,无法有效捕捉用户移动模式和本地服务场景中的空间上下文关系。这导致推荐结果可能缺乏相关性和个性化,尤其是在跨城市等复杂场景下表现更差。

核心思路:ROS的核心思路是将地理信息显式地融入到LLM的推理过程中,将其作为一个重要的决策变量。通过对地理空间进行离散化和语义编码,并结合链式思考范式,引导LLM逐步推理出用户的潜在意图和偏好,从而生成更准确的推荐结果。

技术框架:ROS框架包含三个主要阶段:1) 用户个性建模:利用用户历史行为数据,提取用户在地理位置和POI类型上的偏好,形成用户画像。2) 意图对齐候选空间构建:基于用户画像和当前位置,生成一个包含多个候选POI的候选空间,这些POI在语义上与用户的潜在意图对齐。3) 基于位置信息的剪枝:利用层级空间语义ID,对候选空间中的POI进行排序和筛选,选择与用户当前位置最相关的POI作为最终推荐结果。

关键创新:ROS的关键创新在于引入了层级空间语义ID (SID) 和移动链式思考 (CoT) 范式。SID能够将地理空间信息进行多粒度的离散化和语义编码,使得LLM能够更好地理解和利用地理信息。CoT范式则通过模拟人类的思考过程,引导LLM逐步推理出用户的潜在意图和偏好。

关键设计:层级空间语义ID的设计考虑了地理空间的层级结构,例如城市、区域、街道等。每个层级对应一个ID,通过组合不同层级的ID,可以表示一个特定位置的语义信息。移动链式思考范式包含三个阶段:用户个性建模、意图对齐候选空间构建和基于位置信息的剪枝。每个阶段都采用了特定的技术手段,例如注意力机制、强化学习等,以提高模型的性能。

📊 实验亮点

在三个广泛使用的LBSN数据集上,ROS在命中率方面比最强的基于LLM的基线方法实现了超过10%的相对收益。此外,ROS还提高了跨城市迁移能力,这意味着ROS能够更好地适应不同的地理环境和用户群体。值得注意的是,ROS使用了更小的骨干模型,这表明ROS在性能提升的同时,也具有更高的效率。

🎯 应用场景

ROS框架可应用于各种基于位置的推荐场景,例如旅游推荐、餐饮推荐、本地服务推荐等。通过利用地理信息,ROS能够为用户提供更个性化、更相关的推荐结果,提升用户体验。此外,ROS还可以应用于跨城市推荐等复杂场景,帮助用户发现新的地点和体验。

📄 摘要(原文)

Generative recommendation with large language models (LLMs) reframes prediction as sequence generation, yet existing LLM-based recommenders remain limited in leveraging geographic signals that are crucial in mobility and local-services scenarios. Here, we present Reasoning Over Space (ROS), a framework that utilizes geography as a vital decision variable within the reasoning process. ROS introduces a Hierarchical Spatial Semantic ID (SID) that discretizes coarse-to-fine locality and POI semantics into compositional tokens, and endows LLM with a three-stage Mobility Chain-of-Thought (CoT) paradigm that models user personality, constructs an intent-aligned candidate space, and performs locality informed pruning. We further align the model with real world geography via spatial-guided Reinforcement Learning (RL). Experiments on three widely used location-based social network (LBSN) datasets show that ROS achieves over 10% relative gains in hit rate over strongest LLM-based baselines and improves cross-city transfer, despite using a smaller backbone model.