ML-SceGen: A Multi-level Scenario Generation Framework
作者: Yicheng Xiao, Yangyang Sun, Yicheng Lin
分类: cs.AI
发布日期: 2025-01-18
备注: 7 pages
💡 一句话要点
提出ML-SceGen框架,实现用户可控的综合性危险场景生成
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 场景生成 大型语言模型 答案集编程 自动驾驶 安全测试
📋 核心要点
- 现有场景生成方法主要集中于全面或危险场景,缺乏对生成过程的有效控制。
- ML-SceGen框架通过三阶段流程,结合LLM和ASP求解器,实现用户可控的综合性危险场景生成。
- 该框架能够生成包含危险因素的复杂交通场景,为自动驾驶安全测试提供更有效的工具。
📝 摘要(中文)
本文提出了一种三阶段框架ML-SceGen,旨在利用大型语言模型进行场景生成,不仅使用户能够重新掌控生成的场景,还能在不受控制的交叉路口环境中生成包含危险因素的综合性场景。第一阶段,LLM智能体将描述的关键组成部分转化为功能性场景。第二阶段,使用答案集编程(ASP)求解器Clingo来生成交叉路口内全面的逻辑交通。最后阶段,利用LLM更新相关参数,以提高具体场景的危险等级。
🔬 方法详解
问题定义:现有利用大型语言模型进行场景生成的方法,要么只关注全面的场景,要么只关注危险的场景,缺乏对生成场景的细粒度控制,难以满足特定测试需求。此外,在不受控的交叉路口环境中生成包含危险因素的综合性场景仍然是一个挑战。
核心思路:ML-SceGen的核心思路是将场景生成过程分解为三个阶段,每个阶段侧重于不同的方面,并利用不同的技术来实现。第一阶段利用LLM理解用户意图并生成功能性场景;第二阶段利用ASP求解器生成逻辑上合理的交通流;第三阶段再次利用LLM调整参数,增加场景的危险程度。这种分阶段的方法使得用户可以更好地控制生成过程,并生成更符合需求的场景。
技术框架:ML-SceGen框架包含三个主要阶段: 1. 功能性场景生成阶段:利用LLM将用户对期望场景的描述转化为功能性场景,明确场景的关键组成部分。 2. 逻辑交通生成阶段:使用ASP求解器Clingo,在交叉路口内生成全面的、逻辑上合理的交通流。 3. 危险等级提升阶段:利用LLM更新相关参数,例如车辆速度、加速度等,以提高具体场景的危险等级。
关键创新:该框架的关键创新在于结合了LLM的自然语言理解能力和ASP求解器的逻辑推理能力,实现了一种用户可控的、综合性的危险场景生成方法。与现有方法相比,ML-SceGen能够生成更复杂、更真实的交通场景,并且用户可以根据自己的需求调整场景的各个方面。
关键设计:在功能性场景生成阶段,需要设计合适的prompt,引导LLM生成符合用户意图的场景描述。在逻辑交通生成阶段,需要定义合适的ASP规则,确保生成的交通流在逻辑上是合理的,例如避免车辆碰撞等。在危险等级提升阶段,需要选择合适的参数进行调整,例如车辆速度、加速度、跟车距离等,以提高场景的危险程度。
🖼️ 关键图片
📊 实验亮点
论文提出的ML-SceGen框架能够生成包含危险因素的综合性交通场景,为自动驾驶安全测试提供更有效的工具。具体性能数据和对比基线在摘要中未提及,属于未知信息。
🎯 应用场景
ML-SceGen可应用于自动驾驶系统的安全测试和验证,通过生成各种复杂和危险的交通场景,帮助开发者发现和修复系统中的潜在问题。此外,该框架还可以用于驾驶员行为研究和交通仿真等领域,为提高交通安全提供支持。
📄 摘要(原文)
Current scientific research witnesses various attempts at applying Large Language Models for scenario generation but is inclined only to comprehensive or dangerous scenarios. In this paper, we seek to build a three-stage framework that not only lets users regain controllability over the generated scenarios but also generates comprehensive scenarios containing danger factors in uncontrolled intersection settings. In the first stage, LLM agents will contribute to translating the key components of the description of the expected scenarios into Functional Scenarios. For the second stage, we use Answer Set Programming (ASP) solver Clingo to help us generate comprehensive logical traffic within intersections. During the last stage, we use LLM to update relevant parameters to increase the critical level of the concrete scenario.