发明名称 基于AR集成学模型的锂离子电池剩余寿命预测方法
摘要 基于AR集成学模型的锂离子电池剩余寿命预测方法,涉及锂离子电池剩余寿命预测方法。为了解决现有单一的AR模型在非线性时间序列预测中的精度有限的问题和稳定度低的问题,本发明基于AR集成学模型的对锂离子电池剩余寿命进行预测,用Bagging(Bootstrap Aggregating)集成方法随机选取输入数据构成的向量,形成一组子向量集,每个向量集输入一个AR模型进行参数计算和容量预测,最后将预测结果进行融合输出,并绘制容量退化曲线和概率密度曲线,从而得到最终的预测输出。本发明可以提高锂离子电池剩余寿命预测的稳定性和精度。本发明适用于锂离子电池剩余寿命预测。
申请公布号 CN104090238B 申请公布日期 2016.09.28
申请号 CN201410276350.0 申请日期 2014.06.19
申请人 哈尔滨工业大学 发明人 刘大同;彭宇;卢斯远;彭喜元
分类号 G01R31/36(2006.01)I 主分类号 G01R31/36(2006.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 杨立超
主权项 基于AR集成学习模型的锂离子电池剩余寿命预测方法,其特征在于它包括下述步骤:步骤1:根据电池的容量失效阈值,从电池的容量数据中得到电池的寿命终止时间,时间量化表征为电池充放电的循环次数;将寿命终止时循环次数的a%处,作为预测起始点;提取容量数据,将其作为阶次判断的原始的输入数据F,并将F进行标准化处理,得到标准化数据Y;零均值化:求取输入数据F的均值Fmean,得到零均值化的序列f=F‑Fmean;方差标准化:求取序列f的标准差σ<sub>f</sub>,得到标准化数据Y=f/σ<sub>f</sub>;步骤2:计算标准化数据Y的0步自协方差:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>R</mi><mn>0</mn></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>L</mi><mn>1</mn></mrow></munderover><mfrac><mrow><msup><mi>Y</mi><mn>2</mn></msup><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow><mrow><mi>L</mi><mn>1</mn></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000964366770000011.GIF" wi="1038" he="134" /></maths>其中,R<sub>0</sub>为数据的0步自协方差,Y(i)表示Y中的第i个数据,L1为数据长度;计算标准化数据Y的1~20步自协方差:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>R</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mi>k</mi><mo>+</mo><mn>1</mn></mrow><mrow><mi>L</mi><mn>1</mn></mrow></munderover><mfrac><mrow><mi>Y</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>&CenterDot;</mo><mi>Y</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mi>k</mi><mo>)</mo></mrow></mrow><mrow><mi>L</mi><mn>1</mn></mrow></mfrac><mo>,</mo><mrow><mo>(</mo><mi>k</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mn>20</mn><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000964366770000012.GIF" wi="1298" he="127" /></maths>R(k)为k步的自协方差,k取1~20,Y(i‑k)为标准化数据Y中的第i‑k个数据;根据0步自协方差和1~20步自协方差,计算自相关系数:ρ(k)=R(k)/R<sub>0</sub>  (3)步骤3:绘制自相关系数曲线,观察曲线趋势,若曲线呈递减趋势,或在某阶后纵坐标变为0,则判断为满足截尾特性,若截尾则适合MA建模,且MA模型可以用AR模型进行替换,直接进行步骤5;若不截尾则进行步骤4;步骤4:根据步骤2得到的自相关系数求解得到偏自相关系数,并绘制偏自相关系数曲线,观察曲线趋势,若曲线呈递减趋势,或在某阶后纵坐标变为0,则判断为满足截尾特性,适合AR建模,若不满足截尾特性,则不适合AR建模,选取满足截尾特性曲线的数据进行步骤5;步骤5:根据AIC准则判断最佳AR模型阶次,进行模型阶次p=1~12对应的AIC值的求取,并判断大小,取AIC值最小时所对应的模型阶次p作为针对当前建模数据的最佳AR模型阶次;步骤6:根据所求的最佳阶次p,将输入数据F中每p+1个连续的数据构造成一个维数为p+1的训练向量,L1个连续的输入数据可以构成L1‑p个p+1维的训练向量,每个训练向量的前p个数构成输入向量,每个训练向量的最后一个数所在的时刻作为预测时间点,此数据作为该预测时间点的真实输出数值,即预测真值x<sub>t</sub>;L1‑p个p+1维的训练向量构成原始训练向量集J<sub>0</sub>;步骤7:用Bagging集成方法随机选取训练向量:J<sub>0</sub>中含有L1‑p个训练向量,从L1‑p个训练向量中采用有放回的均匀抽样;由此得到一个和J<sub>0</sub>规模相等的新训练向量集J<sub>1</sub>,即和训练向量个数相等的新训练向量集J<sub>1</sub>,J<sub>0</sub>中有些训练向量在J<sub>1</sub>中出现的次数多于一次,而有些训练向量在J<sub>1</sub>中则没有出现;步骤8:执行N<sub>1</sub>次步骤7,即在J<sub>0</sub>中进行N<sub>1</sub>次重复采样过程,9&lt;N<sub>1</sub>&lt;101,得到N<sub>1</sub>个新的训练向量集J<sub>i</sub>,i取1~N<sub>1</sub>;步骤9:忽略噪声的干扰,设AR子模型的方程如式:<img file="FDA0000964366770000021.GIF" wi="1670" he="263" />xp<sub>t</sub>为每一时刻t处AR子模型预测输出的数值,x为输入数据F中每一时刻t处的输入数值,<img file="FDA0000964366770000022.GIF" wi="134" he="55" />为AR子模型的系数;p为模型的阶次,Ψ为<img file="FDA0000964366770000023.GIF" wi="134" he="55" />构成的系数矩阵;Χ<sup>‑1</sup>为x<sub>t‑1</sub>~x<sub>t‑p</sub>构成的p*1的矩阵,Χ即为维数为p的向量,也就是步骤6中构造的输入向量;针对每一个新的训练向量集J<sub>i</sub>,由于xp<sub>t</sub>是有关于<img file="FDA0000964366770000024.GIF" wi="43" he="47" />的函数,利用最小二乘的原理,使得公式:<img file="FDA0000964366770000025.GIF" wi="390" he="134" />中LS的数值最小,即可完成每个AR子模型自回归系数<img file="FDA0000964366770000026.GIF" wi="43" he="54" />的求取;求取各个系数的数值确定模型阶次和模型参数后,完成每个AR子模型的建立;步骤10:完成AR子模型建立后,进行AR子模型的测试预测输出过程,预测输出模型如(5)所示:<img file="FDA0000964366770000027.GIF" wi="1182" he="71" /><img file="FDA0000964366770000028.GIF" wi="134" he="55" />为步骤9中得到的AR子模型的系数;e取1~L<sub>2</sub>,L<sub>2</sub>为测试过程中需要得到的预测值个数;将每个AR子模型训练向量集中的最后一个训练向量的后p个数作为测试初始输入状态数据h<sub>11</sub>~h<sub>p1</sub>,构成初始输入向量;代入(5)所示的模型;可以得到此时刻l<sub>1</sub>的输出值y<sub>1</sub>;将y<sub>1</sub>作为下一时刻l<sub>2</sub>的最后一个输入数据h<sub>p2</sub>,l<sub>1</sub>时刻输入向量的后p‑1个数据作为h<sub>12</sub>~h<sub>(p‑1)2</sub>;y<sub>1</sub>和l<sub>1</sub>时刻输入向量的后p‑1个数据构成l<sub>2</sub>时刻的输入向量;代入公式(5)得到y<sub>2</sub>;重复这一过程共L<sub>2</sub>次,不断进行迭代计算,就可以得到长期预测输出f<sub>i</sub>;步骤11:将N<sub>1</sub>个AR子模型的输出f<sub>i</sub>,i=1,2,…,N<sub>1</sub>,进行平均计算得到某一预测起始点的融合输出<img file="FDA0000964366770000031.GIF" wi="96" he="63" />计算公式如式:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>f</mi><msub><mi>M</mi><mn>1</mn></msub></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mn>1</mn></msub></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mn>1</mn></msub></munderover><msub><mi>f</mi><mi>i</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000964366770000032.GIF" wi="1100" he="135" /></maths>步骤12:改变预测起始点Z次,即改变a的大小Z次,其中,a的值从取30开始,每次增加5,直至取到70为止;重复步骤1‑步骤11,计算得到Z个新的预测起始点的融合输出<img file="FDA0000964366770000033.GIF" wi="99" he="70" />其中j取1~Z,并将不同预测起始点的输出进一步融合得到最终预测输出f<sub>F</sub>,其公式为:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>f</mi><mi>F</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>Z</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>Z</mi></munderover><msub><mi>f</mi><msub><mi>M</mi><mi>j</mi></msub></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000964366770000034.GIF" wi="1070" he="134" /></maths>f<sub>F</sub>代表最终预测输出的锂离子电池容量;步骤13:绘制容量退化曲线,并求出退化曲线与电池失效阈值线的交点,其横坐标为电池放电循环次数,记为EOP(End of Prediction);步骤14:重复步骤1‑步骤13,得到多组集成预测EOP结果后,对数据的分布形式进行分析;检测预测结果是否满足正态分布的形式:<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><msqrt><mrow><mn>2</mn><mi>&pi;</mi></mrow></msqrt><mi>&sigma;</mi></mrow></mfrac><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><msup><mrow><mo>(</mo><mi>x</mi><mo>-</mo><mi>&mu;</mi><mo>)</mo></mrow><mn>2</mn></msup><mrow><mn>2</mn><msup><mi>&sigma;</mi><mn>2</mn></msup></mrow></mfrac><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000964366770000035.GIF" wi="1205" he="127" /></maths>其中,x为一组EOP的数值,μ为数据组x的平均值,σ为数据组x的方差;如果预测结果满足正态分布,则计算μ、σ的值;根据μ、σ的值,计算EOP分别在68%、95%、99%概率下的置信区间,并绘制概率密度曲线,从而得到RUL的区间估计和概率分布信息,即最终的预测输出。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号