A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science

作者: Jie Feng, Jinwei Zeng, Qingyue Long, Hongyi Chen, Jie Zhao, Yanxin Xi, Zhilun Zhou, Yuan Yuan, Shengyuan Wang, Qingbin Zeng, Songwei Li, Yunke Zhang, Yuming Lin, Tong Li, Jingtao Ding, Chen Gao, Fengli Xu, Yong Li

分类: cs.AI, cs.CL

发布日期: 2025-04-14

💡 一句话要点

综述：大语言模型驱动的跨尺度空间智能研究进展

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 空间智能 大语言模型 具身智能 智能城市 地球科学 空间认知 知识表示

📋 核心要点

现有空间智能研究主要集中在视觉具身智能，忽略了城市规划、遥感等更广泛领域。
本文从人类空间认知出发，分析LLM在空间记忆、知识表示和抽象推理方面的能力。
论文构建了从具身、城市到全球尺度的空间智能框架，旨在促进跨学科研究。

📝 摘要（中文）

过去一年，大型语言模型（LLM）的发展使空间智能成为焦点，尤其是在基于视觉的具身智能方面。然而，空间智能跨越了更广泛的学科和尺度，从导航和城市规划到遥感和地球科学。本文首先回顾了人类的空间认知及其对LLM中空间智能的影响。然后，我们考察了LLM中的空间记忆、知识表示和抽象推理，强调它们的作用和联系。最后，我们分析了跨尺度的空间智能——从具身到城市和全球层面——遵循从空间记忆和理解到空间推理和智能的框架。通过本次调查，我们旨在深入了解跨学科的空间智能研究，并激发未来的研究。

🔬 方法详解

问题定义：现有空间智能研究存在领域分割问题，缺乏对不同尺度（具身、城市、全球）空间智能的统一视角和理解。现有方法往往针对特定任务设计，泛化能力有限，难以应对复杂和动态的空间环境。此外，如何有效利用大语言模型增强空间智能，仍面临知识表示、推理和规划等挑战。

核心思路：本文的核心思路是构建一个跨尺度的空间智能框架，将不同领域的空间智能问题统一起来，并分析大语言模型在空间记忆、知识表示、抽象推理等方面的能力。通过借鉴人类空间认知机制，探索如何利用大语言模型提升空间智能的通用性和鲁棒性。

技术框架：该综述论文并未提出新的技术框架，而是对现有研究进行梳理和分析。其框架主要包含三个层次：1) 人类空间认知：回顾人类空间认知机制，为LLM空间智能研究提供理论基础。2) LLM空间能力：分析LLM在空间记忆、知识表示和抽象推理方面的能力，探讨其优势和局限性。3) 跨尺度空间智能：从具身、城市到全球层面，分析不同尺度的空间智能问题，并探讨LLM的应用前景。

关键创新：该论文的关键创新在于提出了一个跨尺度的空间智能研究框架，将不同领域的空间智能问题联系起来，并强调了大语言模型在提升空间智能方面的潜力。它并非提出一种新的算法或模型，而是提供了一个新的视角和研究方向。

关键设计：由于是综述论文，没有具体的参数设置、损失函数或网络结构等技术细节。论文侧重于对现有研究的归纳和分析，并提出了未来研究方向的建议。

🖼️ 关键图片

📊 实验亮点

该论文是一篇综述性文章，没有具体的实验结果。其亮点在于对大语言模型驱动的空间智能研究进行了全面的梳理和分析，并提出了一个跨尺度的研究框架。该框架有助于研究人员更好地理解不同领域的空间智能问题，并促进跨学科的合作。

🎯 应用场景

该研究对具身智能、智能城市、地球科学等领域具有广泛的应用前景。例如，可以用于开发更智能的机器人导航系统、更高效的城市规划方案、更准确的遥感图像分析方法。通过提升大语言模型的空间智能，可以实现更智能、更可持续的未来。

📄 摘要（原文）

Over the past year, the development of large language models (LLMs) has brought spatial intelligence into focus, with much attention on vision-based embodied intelligence. However, spatial intelligence spans a broader range of disciplines and scales, from navigation and urban planning to remote sensing and earth science. What are the differences and connections between spatial intelligence across these fields? In this paper, we first review human spatial cognition and its implications for spatial intelligence in LLMs. We then examine spatial memory, knowledge representations, and abstract reasoning in LLMs, highlighting their roles and connections. Finally, we analyze spatial intelligence across scales -- from embodied to urban and global levels -- following a framework that progresses from spatial memory and understanding to spatial reasoning and intelligence. Through this survey, we aim to provide insights into interdisciplinary spatial intelligence research and inspire future studies.

A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理