一种神经网络跟踪控制的自适应学率调节方法,申请号CN201410158182.5-传众专利搜索

发明名称	一种神经网络跟踪控制的自适应学率调节方法
摘要	本发明一种神经网络跟踪控制的自适应学率调节方法，包括以下几个步骤：建立控制系统；将神经网络的所有权值按层进行单位化；引入训练样本集得到误差信号e(n)和训练代价函数ε(n)；得到线性化后的活化函数s(x)；确定各神经元的诱导局部域及神经元输出；求解各个局部梯度函数δ<sub>j</sub>(n)及线性化表示δ<sub>jL</sub>(n)；选择的自适应调整学率；训练神经元突触权值；循环次数加1，直至满足停止准则，输出跟踪控制信号。本发明提出一种能够使步长迭代均值不受噪声影响，具有平滑迭代曲线，并可充分利用误差信号的一种基于活化函数及多误差信号的学率自适应调节方法，从而可实时更新学率，且减小计算复杂度。
申请公布号	CN103926832A	申请公布日期	2014.07.16
申请号	CN201410158182.5	申请日期	2014.04.18
申请人	哈尔滨工程大学	发明人	袁赣南;杜雪;吴迪;夏庚磊;常帅;李旺;贾韧锋;张靖靖
分类号	G05B13/00(2006.01)I	主分类号	G05B13/00(2006.01)I
代理机构		代理人
主权项	一种神经网络跟踪控制的自适应学习率调节方法，其特征在于：包括以下几个步骤，步骤一：建立控制系统，神经网络采用MISO的多层反馈网结构，各神经元函数为活化函数，设置循环停止准则；神经网络的状态空间的权值空间W<sub>k</sub>和网络输出Z<sub>k</sub>为：<maths num="0001" id="cmaths0001"><math><![CDATA[<mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>W</mi><mi>k</mi></msub><mo>=</mo><msub><mi>W</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>+</mo><msub><mi>φ</mi><mi>k</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Z</mi><mi>k</mi></msub><mo>=</mo><mi>ψ</mi><mrow><mo>(</mo><msub><mi>W</mi><mi>k</mi></msub><mo>,</mo><msub><mi>U</mi><mi>k</mi></msub><mo>)</mo></mrow></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0000493187450000011.GIF" wi="358" he="169" /></maths>其中U<sub>k</sub>为网络输入，φ<sub>k</sub>为权值更新函数，ψ(W<sub>k</sub>,U<sub>k</sub>)为参数化的非线性函数，小波网络的权值空间为W<sub>k</sub>，将权值空间中的每个权值生成[‑1,1]区间上均匀分布的随机数；步骤二：将神经网络的所有权值按层进行单位化；步骤三：引入训练样本集{x(n),norm(n)}，依次输入向量x(1)，x(2)……x(n)，并记录网络输出z(1)，z(2)……z(n)，得到误差信号e(n)和训练代价函数ε(n)：e(n)＝norm(n)‑z(n)<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>ϵ</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><msup><mi>e</mi><mn>2</mn></msup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000493187450000012.GIF" wi="343" he="125" /></maths>步骤四：得到线性化后的活化函数s(v(n))：<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>s</mi><mrow><mo>(</mo><mi>v</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mi>a</mi><mo>,</mo></mtd><mtd><mi>v</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>></mo><msub><mi>θ</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><mi>c</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mi>v</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>+</mo><mi>d</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mo>,</mo></mtd><mtd><msub><mi>θ</mi><mn>2</mn></msub><mo><</mo><mi>v</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo><</mo><msub><mi>θ</mi><mn>1</mn></msub><mo>,</mo><mi>m</mi><mo>=</mo><mn>1</mn><mi>m</mi><mn>2</mn><mo>.</mo><mo>.</mo><mo>.</mo><mi>M</mi></mtd></mtr><mtr><mtd><mi>b</mi><mo>,</mo></mtd><mtd><mi>v</mi><mrow><mo>(</mo><mi>θ</mi><mo>)</mo></mrow><mo><</mo><msub><mi>θ</mi><mn>2</mn></msub></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000493187450000013.GIF" wi="1201" he="258" /></maths>M＝λ(θ<sub>1</sub>+θ<sub>2</sub>),M为奇数s(v(n))分为上下饱和边界和线性拟合区域，其中M为奇数以保证(0,0)或(0,y<sub>0</sub>)不在分割界上，a和b分别为函数的上下饱和边界，θ<sub>1</sub>和θ<sub>2</sub>分别为饱和边界的阈值，c(m)和d(m)为线性区域系数，λ为常值系数；步骤五：确定各神经元的诱导局部域及神经元输出，诱导局部域和神经元j的输出信号分别为：<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>v</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>I</mi></munderover><msub><mi>w</mi><mi>ij</mi></msub><msub><mi>z</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>Z</mi><mi>i</mi><mi>T</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><msub><mi>W</mi><mi>ij</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000493187450000014.GIF" wi="698" he="120" /></maths><img file="FDA0000493187450000015.GIF" wi="317" he="93" />其中v<sub>j</sub>(n)为诱导局部域，w<sub>ij</sub>为权值，z<sub>i</sub>(n)为上层神经元输出，W<sub>ij</sub>和Z<sub>i</sub>(n)分别为w<sub>ij</sub>和z<sub>i</sub>(n)构成的向量，I为上层神经元总数，<img file="FDA0000493187450000024.GIF" wi="130" he="86" />为j层的活化函数；步骤六：求解各个局部梯度函数δ<sub>j</sub>(n)及线性化表示δ<sub>jL</sub>(n)；<img file="FDA0000493187450000021.GIF" wi="1027" he="227" /><img file="FDA0000493187450000022.GIF" wi="1044" he="227" />步骤七：选择自适应调整学习率为：μ(n+1)＝αμ(n)+γ[(1‑β)+e(n)e(n‑1)+βe(n‑1)e(n‑2)+...+β<sup>ν‑1</sup>e(n‑ν+1)e(n‑ν)]其中0＜α＜1，0＜β＜1，γ＞0，同时学习率满足条件：<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mi>μ</mi><mrow><mo>(</mo><mi>n</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>μ</mi><mi>max</mi></msub></mtd><mtd><mi>μ</mi><mo>></mo><msub><mi>μ</mi><mi>max</mi></msub></mtd></mtr><mtr><mtd><mi>g</mi><mrow><mo>(</mo><mi>μ</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>,</mo><mi>e</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>,</mo><mi>e</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>e</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mi>v</mi><mo>)</mo></mrow><mo>)</mo></mrow></mtd><mtd><msub><mi>μ</mi><mi>min</mi></msub><mo><</mo><mi>μ</mi><mo><</mo><msub><mi>μ</mi><mi>max</mi></msub></mtd></mtr><mtr><mtd><msub><mi>μ</mi><mi>min</mi></msub></mtd><mtd><mi>μ</mi><mo><</mo><msub><mi>μ</mi><mi>min</mi></msub></mtd></mtr></mtable></mfenced><mo>;</mo></mrow>]]></math><img file="FDA0000493187450000023.GIF" wi="1314" he="250" /></maths>步骤八：训练神经元突触权值；突触权值的调整过程中采用局部梯度δ<sub>j</sub>(n)，具体描述如下：w<sub>ij</sub>(n+1)＝w<sub>ij</sub>(n)+Δw<sub>ij</sub>(n)Δw<sub>ij</sub>(n)＝μ(n)δ<sub>j</sub>(n)z<sub>i</sub>(n)；步骤九：循环次数加1，返回步骤五，直至满足停止准则，输出跟踪控制信号；步骤十：将控制信号输入执行机构并与系统进行计算融合，输出被控参数值，并与预期量进行比较，完成闭环反馈控制过程。
地址	150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室