First, Learn What You Don't Know: Active Information Gathering for Driving at the Limits of Handling

作者: Alexander Davydov, Franck Djeumou, Marcus Greiff, Makoto Suminaka, Michael Thompson, John Subosits, Thomas Lew

分类: cs.RO, cs.LG, eess.SY

发布日期: 2024-10-31 (更新: 2025-07-23)

💡 一句话要点

提出主动信息收集框架，解决车辆极限操控时在线学习不足的问题。

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 主动信息收集 车辆动力学 贝叶斯元学习 模型预测控制 极限操控 在线自适应 漂移控制

📋 核心要点

车辆极限操控时，在线自适应学习速度可能不足以应对快速变化的动力学特性，导致控制失败。
提出主动信息收集框架，利用贝叶斯元学习快速适应车辆动力学模型，并指导数据采集。
在丰田Supra漂移实验中验证了框架的有效性，表明主动数据收集能显著提升控制可靠性。

📝 摘要（中文）

本文提出了一种主动信息收集框架，旨在尽快识别车辆动力学特性，从而解决在线自适应在不稳定系统上的应用难题。该框架结合了在线自适应的数据驱动模型和模型预测控制（MPC），特别针对车辆在极限操控（如漂移避障）时，轮胎达到摩擦极限导致车辆失稳，建模误差迅速累积的问题。论文提出了一种富有表达力的车辆动力学模型，该模型利用贝叶斯最后一层元学习实现快速在线自适应。模型的不确定性估计用于指导信息量大的数据收集，从而在部署前快速改进模型先验。在丰田Supra上的动态漂移实验表明，该框架能够可靠地控制处于稳定边缘的车辆，而仅靠在线自适应可能不足以实现零样本控制，并可能导致不良的瞬态误差或侧滑，主动数据收集有助于实现可靠的性能。

🔬 方法详解

问题定义：论文旨在解决车辆在极限操控状态下，由于车辆动力学模型不准确导致的控制问题。传统的在线自适应方法在面对车辆快速变化和不稳定的动力学特性时，学习速度可能不足以保证控制的可靠性。尤其是在车辆接近或超过其物理极限时，建模误差会迅速累积，导致车辆失控。

核心思路：论文的核心思路是通过主动信息收集来加速车辆动力学模型的学习过程。通过在实际部署前，主动设计并执行能够提供丰富信息的实验，从而快速提升模型的先验知识，减少在线自适应阶段的学习负担。这种方法旨在确保模型在部署初期就具备足够的准确性，从而提高控制系统的鲁棒性和可靠性。

技术框架：该框架包含以下几个主要模块：1) 车辆动力学模型：使用一种富有表达力的模型来描述车辆的动力学特性。2) 贝叶斯最后一层元学习：利用贝叶斯元学习方法，实现模型的快速在线自适应。3) 不确定性估计：对模型的不确定性进行估计，用于指导数据收集过程。4) 主动信息收集策略：根据模型的不确定性，设计能够提供最大信息增益的实验。5) 模型预测控制（MPC）：使用学习到的车辆动力学模型进行控制。整体流程是首先进行主动信息收集，然后利用收集到的数据训练车辆动力学模型，最后将训练好的模型用于MPC控制。

关键创新：论文的关键创新在于将主动信息收集与贝叶斯元学习相结合，用于解决车辆极限操控时的控制问题。与传统的在线自适应方法相比，该方法能够更快速、更有效地学习车辆动力学模型，从而提高控制系统的鲁棒性和可靠性。此外，利用模型的不确定性来指导数据收集，能够更有效地利用实验资源，提高学习效率。

关键设计：论文使用贝叶斯最后一层元学习，这意味着只有模型的最后一层参数会进行在线更新，从而减少了计算负担，加快了学习速度。不确定性估计通常基于模型的后验分布，例如可以使用高斯过程或贝叶斯神经网络来估计模型的不确定性。主动信息收集策略的设计需要考虑多种因素，例如实验的成本、安全性以及能够提供的信息增益。常用的信息增益指标包括互信息、KL散度等。

🖼️ 关键图片

📊 实验亮点

实验结果表明，所提出的主动信息收集框架能够显著提高车辆在极限操控时的控制性能。在丰田Supra上的动态漂移实验中，该框架能够可靠地控制处于稳定边缘的车辆，而仅靠在线自适应可能导致不良的瞬态误差或侧滑。实验还表明，主动数据收集有助于实现可靠的性能，降低了车辆失控的风险。

🎯 应用场景

该研究成果可应用于自动驾驶、赛车运动、车辆安全系统等领域。通过提高车辆在极限操控时的控制能力，可以提升自动驾驶系统的安全性，使其能够更好地应对突发情况。在赛车运动中，可以帮助车手更好地控制车辆，提高比赛成绩。此外，该技术还可以用于开发更先进的车辆安全系统，例如防侧滑系统和紧急避让系统。

📄 摘要（原文）

Combining data-driven models that adapt online and model predictive control (MPC) has enabled effective control of nonlinear systems. However, when deployed on unstable systems, online adaptation may not be fast enough to ensure reliable simultaneous learning and control. For example, a controller on a vehicle executing highly dynamic maneuvers--such as drifting to avoid an obstacle--may push the vehicle's tires to their friction limits, destabilizing the vehicle and allowing modeling errors to quickly compound and cause a loss of control. To address this challenge, we present an active information gathering framework for identifying vehicle dynamics as quickly as possible. We propose an expressive vehicle dynamics model that leverages Bayesian last-layer meta-learning to enable rapid online adaptation. The model's uncertainty estimates are used to guide informative data collection and quickly improve the model prior to deployment. Dynamic drifting experiments on a Toyota Supra show that (i) the framework enables reliable control of a vehicle at the edge of stability, (ii) online adaptation alone may not suffice for zero-shot control and can lead to undesirable transient errors or spin-outs, and (iii) active data collection helps achieve reliable performance.

First, Learn What You Don't Know: Active Information Gathering for Driving at the Limits of Handling

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理