Steins;Gate Drive: Semantic Safety Arbitration over Structured Futures for Latency-Decoupled LLM Planning

📄 arXiv: 2605.22456v1 📥 PDF

作者: Anjie Qiu, Hans D. Schotten

分类: cs.RO, cs.AI

发布日期: 2026-05-21

备注: 10 pages, 2 figures, 5 tables, submitted to IEEE transaction of intelligent vehicles


💡 一句话要点

SteinsGateDrive:面向延迟解耦LLM规划的结构化未来语义安全仲裁

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 自动驾驶 LLM规划 延迟解耦 世界模型 安全仲裁

📋 核心要点

  1. 现有基于云端LLM的自动驾驶方案存在推理延迟过高的问题,难以满足实时控制需求。
  2. SteinsGateDrive通过预测多个未来世界线,并根据安全契约动态选择和复用预测结果,实现延迟解耦。
  3. 实验表明,该方法在保证安全性的前提下,显著降低了有效延迟,甚至实现了负延迟。

📝 摘要(中文)

云端LLM驱动代理提供有用的语义判断,但其推理延迟超过了车辆控制的时间窗口。已学习的世界模型可以预测未来,但通常将未来生成和动作选择置于大型耦合循环中。我们提出了SteinsGateDrive,一种延迟解耦的规划器-运行时架构,其中同名故事中的世界线隐喻命名了干预的一种可能结果:LLM在最终控制时刻之前选择反事实的驾驶未来,并且运行时仅在安全契约保持有效时才重用所选的预测。生成器构建三个世界线角色:alpha标称自我条件未来,beta附近车辆周围的交互反事实,以及gamma危险压力未来,例如制动、切入或阻塞走廊。所选分支成为具有horizon、validity/abort条件、fallback和authority的类型化StrategicForecast。在具有10个种子和20个步骤的受试者内、匹配种子的正常高速公路协议上,GPT-5.4 mini将有效延迟从1秒horizon时的+3.07秒降低到4秒horizon时的-0.01秒,同时保留了测量的无碰撞安全边界。该架构的安全贡献来自原子谓词运行时检查,而不是来自漂移分数,漂移分数用作刷新频率旋钮。

🔬 方法详解

问题定义:现有基于云端LLM的自动驾驶方案,虽然能够提供丰富的语义信息,但其推理延迟过高,无法满足车辆实时控制的需求。传统的基于学习的世界模型虽然可以预测未来,但未来生成和动作选择通常耦合在一起,计算量大,难以快速响应。因此,如何在保证安全性的前提下,降低LLM规划的延迟,是本论文要解决的核心问题。

核心思路:本论文的核心思路是将LLM的规划过程与车辆的实时控制过程解耦。具体来说,LLM提前预测多个可能的未来世界线,并根据当前环境选择一个最合适的未来轨迹。在车辆实际行驶过程中,只要安全契约保持有效,就重复使用该预测结果,从而避免了频繁调用LLM进行推理,降低了延迟。

技术框架:SteinsGateDrive架构包含三个主要模块:世界线生成器、策略预测器和运行时安全仲裁器。世界线生成器负责生成三种类型的未来世界线:alpha(标称未来)、beta(交互反事实)和gamma(危险压力未来)。策略预测器基于生成的未来世界线,选择一个最优的驾驶策略,并将其封装成StrategicForecast对象,该对象包含horizon、validity/abort条件、fallback和authority等属性。运行时安全仲裁器负责在车辆实际行驶过程中,实时检查安全契约是否有效,如果安全契约失效,则重新调用策略预测器选择新的驾驶策略。

关键创新:本论文最重要的技术创新点在于提出了延迟解耦的规划-运行时架构,通过提前预测和复用未来轨迹,有效降低了LLM规划的延迟。此外,论文还提出了基于原子谓词的运行时安全检查机制,确保了车辆行驶的安全性。

关键设计:论文中,世界线生成器生成三种不同类型的未来世界线,分别考虑了不同的场景和风险。StrategicForecast对象包含了丰富的元数据,用于描述驾驶策略的有效性和适用范围。运行时安全仲裁器使用原子谓词来定义安全契约,可以灵活地适应不同的驾驶场景。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,SteinsGateDrive架构在保证安全性的前提下,显著降低了LLM规划的延迟。在正常高速公路场景下,使用GPT-5.4 mini模型,将有效延迟从1秒horizon时的+3.07秒降低到4秒horizon时的-0.01秒,实现了负延迟。这表明该方法能够提前预测并应对潜在的风险,从而提高了自动驾驶系统的性能。

🎯 应用场景

该研究成果可应用于各种自动驾驶场景,尤其是在需要高精度和低延迟的复杂交通环境中。通过降低LLM规划的延迟,可以提高自动驾驶系统的响应速度和安全性,从而提升用户体验。此外,该架构还可以扩展到其他机器人应用领域,例如无人机、服务机器人等。

📄 摘要(原文)

Cloud-hosted LLM driver agents provide useful semantic judgments, but their inference latency exceeds stepwise vehicle-control windows. Learned world models predict futures, but they usually keep future generation and action selection inside large coupled loops. We present SteinsGateDrive, a latency-decoupled planner-runtime architecture in which the worldline metaphor from the eponymous story names one plausible consequence of an intervention: the LLM selects counterfactual driving futures before the final control instant, and a runtime reuses the selected forecast only while safety contracts remain valid. The generator builds three world-line roles: alpha nominal ego-conditioned futures, beta interaction counterfactuals around nearby vehicles, and gamma hazard-stress futures such as braking, cut-ins, or blocked corridors. The selected branch becomes a typed StrategicForecast with horizon, validity/abort conditions, fallback, and authority. On a within-subject, matched-seed normal-highway protocol with 10 seeds and 20 steps, GPT-5.4 mini reduces effective lag from +3.07 s at 1-second horizon to -0.01 s at 4-second horizon while preserving the measured no-collision safety boundary. The architecture's safety contribution comes from the atom-predicate runtime check, not from the drift score, which functions as a refresh-frequency knob.