Deep Reinforcement Learning-Based Optimization of Second-Life Battery Utilization in Electric Vehicles Charging Stations

📄 arXiv: 2502.03412v1 📥 PDF

作者: Rouzbeh Haghighi, Ali Hassan, Van-Hai Bui, Akhtar Hussain, Wencong Su

分类: eess.SY, cs.LG

发布日期: 2025-02-05

备注: 5 pages, 6 figures, Accepted, 2025 IEEE Power and Energy Society General Meeting (PESGM 2025), Austin, TX, USA


💡 一句话要点

提出基于深度强化学习的电动汽车充电站梯次利用电池优化方案

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 深度强化学习 电动汽车充电站 梯次利用电池 软演员-评论家算法 电池储能系统

📋 核心要点

  1. 现有电动汽车充电站(EVCS)规划方法难以应对电动汽车到达时间、电价等不确定性,导致运行效率低下。
  2. 论文提出基于深度强化学习(DRL)的规划框架,利用软演员-评论家(SAC)算法优化EVCS中梯次利用电池(SLB)的使用。
  3. 通过使用一年数据进行离线训练,并设计定制奖励函数,模型能够有效应对季节性变化和不确定性,实现EVCS的实时优化。

📝 摘要(中文)

电动汽车的快速普及带来了大量退役电池的管理难题。研究表明,电动汽车的梯次利用电池(SLB)通常保留了相当大的剩余容量,具有扩展的利用价值。这些电池可以有效地用于电动汽车充电站(EVCS),为新电池提供了一种经济高效的替代方案,并降低了总体规划成本。将带有SLB的电池储能系统(BESS)集成到EVCS中是缓解系统过载的一种有前景的策略。然而,由于电动汽车到达和离开时间的不确定性以及来自电网的可变电价等因素,集成BESS的EVCS的高效运行受到阻碍。本文提出了一种基于深度强化学习(DRL)的EVCS规划框架,该框架利用了SLB。我们采用了先进的软演员-评论家(SAC)方法,使用一年的数据训练模型,以考虑季节性变化,包括工作日和节假日。定制的奖励函数能够进行有效的离线训练,从而可以在不确定性下实时优化EVCS的运营。

🔬 方法详解

问题定义:论文旨在解决电动汽车充电站(EVCS)中梯次利用电池(SLB)的高效利用问题。现有方法难以应对电动汽车到达和离开时间的不确定性以及电网电价的波动,导致EVCS运行效率低下,无法充分发挥SLB的价值。

核心思路:论文的核心思路是利用深度强化学习(DRL)方法,通过学习历史数据和环境信息,优化EVCS的运行策略,从而在不确定性条件下实现SLB的最佳利用。这种方法能够根据实时情况动态调整充电策略,提高EVCS的经济性和可靠性。

技术框架:整体框架包括以下几个主要模块:1) 环境建模:建立EVCS的运行环境模型,包括电动汽车到达模式、电网电价、SLB的性能参数等。2) 智能体设计:设计基于软演员-评论家(SAC)算法的智能体,负责学习和优化EVCS的运行策略。3) 奖励函数设计:设计能够反映EVCS运行目标(如降低成本、提高效率)的奖励函数,引导智能体学习。4) 训练与优化:使用历史数据对智能体进行离线训练,并通过不断迭代优化其策略。

关键创新:论文的关键创新在于将深度强化学习方法应用于EVCS中SLB的优化问题,并采用了软演员-评论家(SAC)算法。SAC算法具有良好的探索能力和稳定性,能够有效地应对环境的不确定性。此外,定制的奖励函数能够更好地引导智能体学习,实现EVCS的优化目标。与传统优化方法相比,DRL方法能够更好地适应动态变化的环境,并实现实时优化。

关键设计:论文中关键的设计包括:1) 使用一年的数据进行训练,以考虑季节性变化的影响。2) 设计了定制的奖励函数,综合考虑了电价、充电需求、SLB的寿命等因素。3) 采用了软演员-评论家(SAC)算法,并对其参数进行了优化,以提高学习效率和稳定性。具体网络结构和参数设置在论文中未详细描述,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文使用一年的数据进行训练,考虑了季节性变化,表明该模型具有良好的泛化能力。虽然论文中没有给出具体的性能数据和对比基线,但强调了定制奖励函数和SAC算法在应对不确定性方面的优势,以及实现EVCS实时优化的能力。具体的性能提升幅度未知。

🎯 应用场景

该研究成果可应用于电动汽车充电站的智能化运营管理,提高充电站的经济效益和资源利用率。通过优化梯次利用电池的使用,可以降低充电站的运营成本,并延长电池的使用寿命。此外,该研究还有助于推动电动汽车的普及和可持续发展,减少对传统能源的依赖。

📄 摘要(原文)

The rapid rise in electric vehicle (EV) adoption presents significant challenges in managing the vast number of retired EV batteries. Research indicates that second-life batteries (SLBs) from EVs typically retain considerable residual capacity, offering extended utility. These batteries can be effectively repurposed for use in EV charging stations (EVCS), providing a cost-effective alternative to new batteries and reducing overall planning costs. Integrating battery energy storage systems (BESS) with SLBs into EVCS is a promising strategy to alleviate system overload. However, efficient operation of EVCS with integrated BESS is hindered by uncertainties such as fluctuating EV arrival and departure times and variable power prices from the grid. This paper presents a deep reinforcement learning-based (DRL) planning framework for EV charging stations with BESS, leveraging SLBs. We employ the advanced soft actor-critic (SAC) approach, training the model on a year's worth of data to account for seasonal variations, including weekdays and holidays. A tailored reward function enables effective offline training, allowing real-time optimization of EVCS operations under uncertainty.