Large Language Models (LLMs) as Traffic Control Systems at Urban Intersections: A New Paradigm

📄 arXiv: 2411.10869v1 📥 PDF

作者: Sari Masri, Huthaifa I. Ashqar, Mohammed Elhenawy

分类: cs.CL, cs.CE, cs.CY, cs.HC

发布日期: 2024-11-16

备注: The data and code that support the findings of this study are openly available in Zenodo at https://doi.org/10.5281/zenodo.14171745, reference number 14171745


💡 一句话要点

提出基于大语言模型(LLM)的城市路口交通控制系统,优化通行效率。

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 交通控制 智能交通系统 冲突检测 思维链提示

📋 核心要点

  1. 现有交通控制系统通常分散且难以整合多源数据,导致决策效率低下。
  2. 利用LLM的推理和决策能力,将多种交通数据整合,实现上下文感知的实时交通控制。
  3. 实验表明,微调后的GPT-mini在交通控制任务中取得了83%的准确率和0.84的F1分数。

📝 摘要(中文)

本研究提出了一种利用大语言模型(LLM)作为交通控制器的交通控制系统新方法。该研究利用LLM的逻辑推理、场景理解和决策能力来优化吞吐量,并根据实时交通状况提供反馈。LLM集中了传统上分离的交通控制流程,并可以整合来自不同来源的交通数据,以提供上下文感知的决策。LLM还可以使用无线信号和视觉信息等各种方式向驾驶员、基础设施和自动驾驶车辆提供定制的输出。为了评估LLM作为交通控制器的能力,本研究提出了一种四阶段方法,包括数据创建和环境初始化、提示工程、冲突识别和微调。我们模拟了多车道四路口场景,并生成了详细的数据集,以使用LLM和Python模拟进行冲突检测。我们使用思维链提示来引导LLM理解上下文、检测冲突、使用交通规则解决冲突,并提供上下文敏感的交通管理解决方案。我们评估了GPT-mini、Gemini和Llama作为交通控制器的性能。结果表明,微调后的GPT-mini实现了83%的准确率和0.84的F1分数。GPT-mini模型在生成可操作的交通管理见解方面表现出良好的性能,在冲突识别、决策制定、优先级分配和等待时间优化方面的ROUGE-L得分分别为0.95、0.91、0.94和0.92。我们证明了LLM可以根据车辆动态向驾驶员提供精确的实时建议,包括让行、减速或停车。

🔬 方法详解

问题定义:现有交通控制系统通常依赖于预设规则和有限的数据输入,难以应对复杂的交通状况和突发事件。传统方法在整合不同来源的交通数据方面存在困难,导致决策过程缺乏全局视野和实时性。此外,向驾驶员提供个性化建议也面临挑战。

核心思路:本研究的核心思路是将LLM作为交通控制器的核心,利用其强大的自然语言处理和推理能力,对交通场景进行理解和分析,并根据交通规则和实时数据做出决策。通过思维链提示(Chain-of-Thought prompting)引导LLM进行上下文理解、冲突检测和解决方案生成,从而实现更智能、更高效的交通控制。

技术框架:该方法包含四个主要阶段:1) 数据创建和环境初始化:构建模拟交通环境,生成包含车辆位置、速度等信息的详细数据集;2) 提示工程:设计合适的提示语,引导LLM理解交通场景并进行推理;3) 冲突识别:利用LLM检测潜在的交通冲突;4) 微调:使用生成的数据集对LLM进行微调,提升其在交通控制任务中的性能。

关键创新:该研究的关键创新在于将LLM应用于交通控制领域,并提出了一种基于思维链提示的交通控制方法。与传统方法相比,该方法能够更好地理解交通场景,整合多源数据,并生成更智能、更个性化的交通管理方案。

关键设计:研究中使用了GPT-mini、Gemini和Llama等LLM模型。通过思维链提示,引导LLM进行交通场景理解、冲突检测、决策制定和优先级分配。使用ROUGE-L指标评估LLM在冲突识别、决策制定、优先级分配和等待时间优化等方面的性能。通过微调进一步提升GPT-mini在交通控制任务中的准确率和F1分数。

📊 实验亮点

实验结果表明,微调后的GPT-mini模型在交通控制任务中取得了显著的性能提升,准确率达到83%,F1分数达到0.84。在冲突识别、决策制定、优先级分配和等待时间优化等方面,GPT-mini的ROUGE-L得分分别达到0.95、0.91、0.94和0.92,表明其在生成可操作的交通管理见解方面具有良好的性能。

🎯 应用场景

该研究成果可应用于智能交通管理系统,提升城市交通效率,减少拥堵和事故发生。通过整合车辆、基础设施和交通管理部门的数据,LLM可以提供实时交通建议,优化交通流量,并支持自动驾驶车辆的安全行驶。未来,该技术有望应用于更复杂的交通场景,如多路口协同控制和应急事件处理。

📄 摘要(原文)

This study introduces a novel approach for traffic control systems by using Large Language Models (LLMs) as traffic controllers. The study utilizes their logical reasoning, scene understanding, and decision-making capabilities to optimize throughput and provide feedback based on traffic conditions in real-time. LLMs centralize traditionally disconnected traffic control processes and can integrate traffic data from diverse sources to provide context-aware decisions. LLMs can also deliver tailored outputs using various means such as wireless signals and visuals to drivers, infrastructures, and autonomous vehicles. To evaluate LLMs ability as traffic controllers, this study proposed a four-stage methodology. The methodology includes data creation and environment initialization, prompt engineering, conflict identification, and fine-tuning. We simulated multi-lane four-leg intersection scenarios and generates detailed datasets to enable conflict detection using LLMs and Python simulation as a ground truth. We used chain-of-thought prompts to lead LLMs in understanding the context, detecting conflicts, resolving them using traffic rules, and delivering context-sensitive traffic management solutions. We evaluated the prformance GPT-mini, Gemini, and Llama as traffic controllers. Results showed that the fine-tuned GPT-mini achieved 83% accuracy and an F1-score of 0.84. GPT-mini model exhibited a promising performance in generating actionable traffic management insights, with high ROUGE-L scores across conflict identification of 0.95, decision-making of 0.91, priority assignment of 0.94, and waiting time optimization of 0.92. We demonstrated that LLMs can offer precise recommendations to drivers in real-time including yielding, slowing, or stopping based on vehicle dynamics.