Urban-MAS: Human-Centered Urban Prediction with LLM-Based Multi-Agent System

📄 arXiv: 2511.00096v1 📥 PDF

作者: Shangyu Lou

分类: cs.MA, cs.AI, cs.CY

发布日期: 2025-10-30

备注: Accepted to The 3rd ACM SIGSPATIAL International Workshop on Advances in Urban AI (UrbanAI'25)

🔗 代码/项目: GITHUB


💡 一句话要点

提出Urban-MAS框架以解决人本城市预测问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 城市人工智能 多智能体系统 大型语言模型 人本预测 信息提取 多模态融合 鲁棒性

📋 核心要点

  1. 现有方法在处理复杂城市系统中的异构数据时,往往在领域特定任务上表现不佳,限制了城市AI的应用。
  2. Urban-MAS框架通过引入三种智能体,优化了知识提取和信息整合,提升了城市预测的准确性和鲁棒性。
  3. 实验结果显示,Urban-MAS在多个城市的预测任务中显著降低了误差,相较于单一LLM基线有明显提升。

📝 摘要(中文)

城市人工智能(Urban AI)在感知预测和人类动态等人本城市任务中取得了进展。大型语言模型(LLMs)能够整合多模态输入以应对复杂城市系统中的异构数据,但在特定领域任务上表现不佳。本文提出了Urban-MAS,一个基于LLM的多智能体系统框架,用于零样本设置下的人本城市预测。该框架包括三种智能体类型:预测因子引导智能体、可靠城市信息提取智能体和多城市信息推理智能体。实验表明,Urban-MAS在东京、米兰和西雅图的运行量预测和城市感知任务中显著降低了误差。消融研究表明,预测因子引导智能体对提升预测性能至关重要,确立了Urban-MAS作为可扩展的人本城市AI预测范式的地位。

🔬 方法详解

问题定义:本文旨在解决城市预测任务中现有方法在处理异构数据时的不足,尤其是在领域特定任务上的低效表现。

核心思路:Urban-MAS框架通过引入三种不同类型的智能体,优化了信息提取和推理过程,以增强预测性能。设计的核心在于利用LLMs的多模态能力,同时克服其在特定领域的局限性。

技术框架:Urban-MAS框架包含三个主要模块:预测因子引导智能体负责识别和引导关键预测因子;可靠城市信息提取智能体通过比较多个输出增强鲁棒性;多城市信息推理智能体整合来自不同源的信息进行综合预测。

关键创新:最重要的创新在于引入了预测因子引导智能体,显著提升了知识提取的有效性和预测的准确性,这一设计在现有方法中并不常见。

关键设计:在模型设计中,智能体之间的协作机制、信息验证流程以及多源信息的整合策略是关键,确保了系统在面对冲突信息时的鲁棒性和一致性。具体的参数设置和损失函数设计未在摘要中详细说明,需参考完整论文。

🖼️ 关键图片

fig_0

📊 实验亮点

实验结果表明,Urban-MAS在运行量预测和城市感知任务中显著降低了误差,相较于单一LLM基线,误差减少幅度达到XX%(具体数据需参考原文),显示出该框架的有效性和优势。

🎯 应用场景

Urban-MAS框架具有广泛的应用潜力,尤其在城市规划、交通管理和公共安全等领域。通过提高城市预测的准确性,该研究能够为城市决策提供更为可靠的数据支持,促进智能城市的发展。未来,Urban-MAS可能会与其他智能系统结合,进一步提升城市管理的智能化水平。

📄 摘要(原文)

Urban Artificial Intelligence (Urban AI) has advanced human-centered urban tasks such as perception prediction and human dynamics. Large Language Models (LLMs) can integrate multimodal inputs to address heterogeneous data in complex urban systems but often underperform on domain-specific tasks. Urban-MAS, an LLM-based Multi-Agent System (MAS) framework, is introduced for human-centered urban prediction under zero-shot settings. It includes three agent types: Predictive Factor Guidance Agents, which prioritize key predictive factors to guide knowledge extraction and enhance the effectiveness of compressed urban knowledge in LLMs; Reliable UrbanInfo Extraction Agents, which improve robustness by comparing multiple outputs, validating consistency, and re-extracting when conflicts occur; and Multi-UrbanInfo Inference Agents, which integrate extracted multi-source information across dimensions for prediction. Experiments on running-amount prediction and urban perception across Tokyo, Milan, and Seattle demonstrate that Urban-MAS substantially reduces errors compared to single-LLM baselines. Ablation studies indicate that Predictive Factor Guidance Agents are most critical for enhancing predictive performance, positioning Urban-MAS as a scalable paradigm for human-centered urban AI prediction. Code is available on the project website:https://github.com/THETUREHOOHA/UrbanMAS