City Editing: Hierarchical Agentic Execution for Dependency-Aware Urban Geospatial Modification

📄 arXiv: 2602.19326v1 📥 PDF

作者: Rui Liu, Steven Jige Quan, Zhong-Ren Peng, Zijun Yao, Han Wang, Zhengzhang Chen, Kunpeng Liu, Yanjie Fu, Dongjie Wang

分类: cs.MA, cs.AI

发布日期: 2026-02-22


💡 一句话要点

提出一种层级Agent框架,用于依赖感知的城市地理空间编辑,提升城市规划效率。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 城市编辑 地理空间修改 Agent系统 层级规划 空间约束

📋 核心要点

  1. 城市规划修改耗时费力,现有方法难以高效处理复杂的地理空间布局编辑任务。
  2. 提出层级Agent框架,通过多层级规划和执行,显式传播空间约束,协调空间元素间的依赖关系。
  3. 实验表明,该方法在城市编辑的效率、鲁棒性、正确性和空间有效性方面均优于现有方法。

📝 摘要(中文)

随着城市发展,交通拥堵和功能失衡等问题日益突出,需要通过高效修改现有规划来进行城市更新,而非完全重新规划。然而,即使是微小的城市变更也需要大量人工来重新绘制地理空间布局,减缓了迭代规划和决策过程。受Agent系统和多模态推理最新进展的启发,我们将城市更新建模为一种机器可执行的任务,该任务迭代地修改以结构化地理空间格式表示的现有城市规划。更具体地说,我们使用GeoJSON表示城市布局,并将自然语言编辑指令分解为跨越多边形、线和点级别操作的层级几何意图。为了协调空间元素和抽象级别之间相互依赖的编辑,我们提出了一个层级Agent框架,该框架联合执行多级规划和执行,并显式传播中间空间约束。我们进一步引入了一种迭代执行-验证机制,以减轻错误累积,并在多步编辑期间强制执行全局空间一致性。在各种城市编辑场景中进行的大量实验表明,与现有基线相比,效率、鲁棒性、正确性和空间有效性均得到了显著提高。

🔬 方法详解

问题定义:论文旨在解决城市规划更新过程中,人工修改地理空间布局效率低下的问题。现有方法在处理复杂城市布局和多步骤编辑时,容易出现错误累积和空间不一致性,难以满足快速迭代规划的需求。

核心思路:论文的核心思路是将城市更新任务建模为机器可执行的任务,利用Agent系统和多模态推理能力,将自然语言指令转化为对城市地理空间数据的修改操作。通过层级化的Agent设计,实现对不同抽象级别(多边形、线、点)的编辑,并显式地考虑空间元素之间的依赖关系。

技术框架:该框架包含以下主要模块:1) 指令解析模块:将自然语言编辑指令解析为层级几何意图,确定需要修改的地理空间元素和操作类型。2) 层级Agent规划模块:基于解析后的意图,生成多层级的编辑计划,包括多边形、线和点级别的操作序列。3) 空间约束传播模块:在编辑过程中,显式地传播中间空间约束,确保编辑操作的空间一致性。4) 迭代执行-验证模块:迭代地执行编辑计划,并在每一步执行后进行验证,以减轻错误累积。

关键创新:该论文的关键创新在于提出了一个层级Agent框架,用于依赖感知的城市地理空间编辑。该框架能够将复杂的城市更新任务分解为多个可执行的子任务,并通过显式传播空间约束来协调不同子任务之间的依赖关系。此外,迭代执行-验证机制能够有效减轻错误累积,提高编辑的准确性和空间有效性。

关键设计:论文使用GeoJSON格式表示城市布局,方便进行结构化处理和编辑。层级Agent框架采用分层结构,每个Agent负责不同抽象级别的编辑任务。迭代执行-验证模块采用空间有效性规则和用户定义的约束条件,对编辑结果进行验证。具体的参数设置、损失函数和网络结构等技术细节在论文中未详细描述,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在各种城市编辑场景中,与现有基线方法相比,效率、鲁棒性、正确性和空间有效性均得到了显著提高。具体的性能数据和提升幅度在摘要中未明确给出,属于未知信息,但强调了整体性能的优越性。

🎯 应用场景

该研究成果可应用于智慧城市建设、城市规划辅助设计、城市更新模拟等领域。通过自动化城市地理空间编辑,可以显著提高城市规划的效率和质量,加速城市更新进程,并为城市管理者提供更科学的决策支持。

📄 摘要(原文)

As cities evolve over time, challenges such as traffic congestion and functional imbalance increasingly necessitate urban renewal through efficient modification of existing plans, rather than complete re-planning. In practice, even minor urban changes require substantial manual effort to redraw geospatial layouts, slowing the iterative planning and decision-making procedure. Motivated by recent advances in agentic systems and multimodal reasoning, we formulate urban renewal as a machine-executable task that iteratively modifies existing urban plans represented in structured geospatial formats. More specifically, we represent urban layouts using GeoJSON and decompose natural-language editing instructions into hierarchical geometric intents spanning polygon-, line-, and point-level operations. To coordinate interdependent edits across spatial elements and abstraction levels, we propose a hierarchical agentic framework that jointly performs multi-level planning and execution with explicit propagation of intermediate spatial constraints. We further introduce an iterative execution-validation mechanism that mitigates error accumulation and enforces global spatial consistency during multi-step editing. Extensive experiments across diverse urban editing scenarios demonstrate significant improvements in efficiency, robustness, correctness, and spatial validity over existing baselines.