Neural Networks for on-chip Model Predictive Control: a Method to Build Optimized Training Datasets and its application to Type-1 Diabetes

📄 arXiv: 2504.11355v1 📥 PDF

作者: Alberto Castillo, Elliot Pryor, Anas El Fathi, Boris Kovatchev, Marc Breton

分类: eess.SY, cs.AI

发布日期: 2025-04-15


💡 一句话要点

提出优化采样数据集(OSD)方法,提升神经网络在片上模型预测控制中的精度,应用于I型糖尿病血糖控制。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 模型预测控制 神经网络 片上系统 最优采样 I型糖尿病 自动胰岛素输送 嵌入式控制

📋 核心要点

  1. 现有方法在训练用于替代MPC的神经网络时,缺乏系统性的训练数据优化方法,导致模型精度受限。
  2. 本研究提出最优采样数据集(OSD)的概念,通过参数化子集选择,保留关键信息、避免冗余状态,并达到数据饱和。
  3. 实验表明,使用OSD训练的神经网络在I型糖尿病自动胰岛素输送任务中,精度提升四倍,并获得临床测试许可。

📝 摘要(中文)

本研究提出了一种利用神经网络(NNs)作为模型预测控制(MPC)算法的有效方法,以在资源受限的嵌入式设备上实现MPC。通过收集大量的输入-输出数据(输入代表系统状态,输出是MPC生成的控制动作),可以训练神经网络以较低的计算成本复制MPC的行为。然而,尽管训练数据的组成对最终神经网络的精度至关重要,但系统地优化训练数据的方法仍未得到充分探索。本文引入了最优采样数据集(OSD)的概念,将其作为理想的训练集,并提出了一种高效的生成算法。OSD是所有可用数据的参数化子集,它(i)在一定的数值分辨率内保留现有的MPC信息,(ii)避免重复或近似重复的状态,并且(iii)变得饱和或完整。我们通过训练神经网络来复制弗吉尼亚大学的I型糖尿病自动胰岛素输送MPC算法,证明了OSD的有效性,最终精度提高了四倍。值得注意的是,两个经过OSD训练的神经网络获得了监管部门的批准,可以作为首个基于神经网络的直接人体胰岛素剂量控制算法进行临床测试。该方法为在资源受限的嵌入式平台上实现高级优化开辟了新的途径,有可能彻底改变复杂算法的部署方式。

🔬 方法详解

问题定义:论文旨在解决在资源受限的片上系统(SoC)中部署模型预测控制(MPC)算法的问题。直接部署MPC计算量大,难以满足实时性要求。现有方法使用神经网络(NN)模仿MPC,但训练数据的质量严重影响NN的性能,而如何系统性地优化训练数据是一个挑战。

核心思路:论文的核心思路是构建“最优采样数据集”(Optimally-Sampled Datasets, OSDs)。OSD是原始数据的子集,它既能充分代表MPC的控制策略,又能避免数据冗余,从而提高NN的训练效率和精度。通过精心设计的采样策略,OSD能够保留关键信息,同时减少训练数据量,降低计算负担。

技术框架:该方法主要包含以下几个阶段:1) 原始数据生成:使用MPC算法生成大量的输入-输出数据,其中输入是系统状态,输出是MPC计算得到的控制动作。2) OSD构建:利用提出的算法从原始数据中选择最优子集,构建OSD。该算法需要设定一些参数,例如数值分辨率,用于控制数据的选择标准。3) 神经网络训练:使用OSD训练神经网络,使其能够模仿MPC的控制行为。4) 模型部署与评估:将训练好的神经网络部署到嵌入式设备上,并评估其性能。

关键创新:该方法最重要的创新点在于提出了OSD的概念和高效的构建算法。与随机采样或全量数据训练相比,OSD能够显著提高NN的训练效率和精度。OSD构建算法的核心在于平衡数据的代表性和数据量,避免冗余数据对训练的干扰。

关键设计:OSD构建算法的关键设计包括:1) 数值分辨率参数:用于控制状态的相似度,避免选择过于接近的状态。2) 饱和度判断标准:用于判断OSD是否已经包含了足够的信息,可以停止采样。3) 神经网络结构:论文中使用的神经网络结构未明确说明,但通常会根据具体的控制任务进行选择,例如多层感知机或循环神经网络。4) 损失函数:使用均方误差(MSE)等回归损失函数,衡量NN输出与MPC输出之间的差异。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,使用OSD训练的神经网络在模拟I型糖尿病患者的血糖控制中,精度比传统方法提高了四倍。更重要的是,基于该方法训练的两个神经网络已经获得了监管部门的批准,可以作为首个基于神经网络的直接人体胰岛素剂量控制算法进行临床测试,这充分证明了该方法的有效性和实用性。

🎯 应用场景

该研究成果可广泛应用于资源受限的嵌入式系统中的复杂控制问题,例如自动驾驶、机器人控制、智能家居等。特别是在医疗领域,如I型糖尿病的自动胰岛素输送,具有重要的实际价值,能够提高患者的生活质量。未来,该方法有望推广到其他慢性疾病的治疗控制中,实现更智能、更个性化的医疗服务。

📄 摘要(原文)

Training Neural Networks (NNs) to behave as Model Predictive Control (MPC) algorithms is an effective way to implement them in constrained embedded devices. By collecting large amounts of input-output data, where inputs represent system states and outputs are MPC-generated control actions, NNs can be trained to replicate MPC behavior at a fraction of the computational cost. However, although the composition of the training data critically influences the final NN accuracy, methods for systematically optimizing it remain underexplored. In this paper, we introduce the concept of Optimally-Sampled Datasets (OSDs) as ideal training sets and present an efficient algorithm for generating them. An OSD is a parametrized subset of all the available data that (i) preserves existing MPC information up to a certain numerical resolution, (ii) avoids duplicate or near-duplicate states, and (iii) becomes saturated or complete. We demonstrate the effectiveness of OSDs by training NNs to replicate the University of Virginia's MPC algorithm for automated insulin delivery in Type-1 Diabetes, achieving a four-fold improvement in final accuracy. Notably, two OSD-trained NNs received regulatory clearance for clinical testing as the first NN-based control algorithm for direct human insulin dosing. This methodology opens new pathways for implementing advanced optimizations on resource-constrained embedded platforms, potentially revolutionizing how complex algorithms are deployed.