发明名称 一种基于干扰观测器的指令滤波反步控制方法
摘要 一种基于干扰观测器的指令滤波反步控制方法,针对多源干扰非线性系统,设计一种抗干扰非线性控制器。本发明包括以下步骤:首先,建立多源干扰系统的非线性数学模型;其次,设计非线性干扰观测器估计系统中的等价干扰;再次,将由非线性干扰观测器得到的等价干扰估计值代入指令滤波反步控制器中,构造抗干扰指令滤波反步控制器;最后,通过极点配置方法设计保证闭环复合误差系统渐近稳定的指令滤波反步控制器增益和非线性干扰观测器增益。本发明所述的控制方法抗干扰能力强,可用于飞行器、机械臂、生化过程和船舶等系统的抗干扰控制。
申请公布号 CN103217902B 申请公布日期 2016.05.25
申请号 CN201310081167.0 申请日期 2013.03.14
申请人 北京航空航天大学 发明人 郭雷;卢昊;王娜;乔建忠;罗建军
分类号 G05B13/04(2006.01)I 主分类号 G05B13/04(2006.01)I
代理机构 北京慧泉知识产权代理有限公司 11232 代理人 王顺荣;唐爱华
主权项 一种基于干扰观测器的指令滤波反步控制方法,其特征在于包括以下步骤:步骤1:建立多源干扰系统的非线性数学模型根据指令滤波反步法递归设计和干扰观测器整体设计两种不同的设计需求,将多源干扰系统的非线性数学模型表示为两种不同的数学描述形式;第一种是子系统描述形式,如下式所示:<maths num="0001"><math><![CDATA[<mrow><msub><mi>&Xi;</mi><mn>1</mn></msub><mo>:</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><msub><mover><mi>x</mi><mo>&CenterDot;</mo></mover><mn>1</mn></msub><mo>=</mo><msub><mi>f</mi><mn>1</mn></msub><mo>(</mo><mi>x</mi><mo>)</mo><mo>+</mo><msub><mi>g</mi><mn>1</mn></msub><mo>(</mo><mi>x</mi><mo>)</mo><msub><mi>x</mi><mn>2</mn></msub><mo>+</mo><msub><mi>d</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><mo>...</mo></mtd></mtr><mtr><mtd><msub><mover><mi>x</mi><mo>&CenterDot;</mo></mover><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>f</mi><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>(</mo><mi>x</mi><mo>)</mo><mo>+</mo><msub><mi>g</mi><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>(</mo><mi>x</mi><mo>)</mo><msub><mi>x</mi><mi>n</mi></msub><mo>+</mo><msub><mi>d</mi><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></msub></mtd></mtr><mtr><mtd><mrow><msub><mover><mi>x</mi><mo>&CenterDot;</mo></mover><mi>n</mi></msub><mo>=</mo><msub><mi>f</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>g</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>u</mi><mo>+</mo><msub><mi>d</mi><mi>n</mi></msub></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000875337110000011.GIF" wi="830" he="358" /></maths>上述微分方程组Ξ<sub>1</sub>中每一项状态方程各自表示一个子系统,其中,x<sub>i</sub>为系统状态变量,i=1,...,n,x=(x<sub>1</sub>,...,x<sub>n</sub>)<sup>T</sup>代表系统状态向量,f<sub>i</sub>(x)和g<sub>i</sub>(x)是系统状态向量x的连续函数,u代表系统控制输入信号,d<sub>i</sub>=(d<sub>1</sub>,...,d<sub>n</sub>)<sup>T</sup>代表每个子系统中参数不确定、未建模动态和外部干扰三类干扰的等价干扰;第二种是状态空间描述形式,如下式所示:<maths num="0002"><math><![CDATA[<mrow><msub><mi>&Xi;</mi><mn>2</mn></msub><mo>:</mo><mover><mi>x</mi><mo>&CenterDot;</mo></mover><mo>=</mo><mi>H</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>+</mo><mi>Z</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>u</mi><mo>+</mo><mi>d</mi></mrow>]]></math><img file="FDA0000875337110000012.GIF" wi="605" he="79" /></maths>其中,H(x)∈R<sup>n</sup>和Z(x)∈R<sup>n</sup>是系统状态向量x的连续非线性函数向量,R<sup>n</sup>表示n维实数集,d代表系统的等价干扰向量,d=(d<sub>1</sub>,...,d<sub>n</sub>)<sup>T</sup>;步骤2:设计非线性干扰观测器估计系统中的等价干扰针对步骤1中建立的状态空间描述形式Ξ<sub>2</sub>中存在的等价干扰向量d,构造非线性干扰观测器为:<maths num="0003"><math><![CDATA[<mrow><mover><mi>w</mi><mo>&CenterDot;</mo></mover><mo>=</mo><mo>-</mo><mi>L</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>w</mi><mo>-</mo><mi>L</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mrow><mo>(</mo><mi>p</mi><mo>(</mo><mi>x</mi><mo>)</mo><mo>+</mo><mi>H</mi><mo>(</mo><mi>x</mi><mo>)</mo><mo>+</mo><mi>Z</mi><mo>(</mo><mi>x</mi><mo>)</mo><mi>u</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000875337110000013.GIF" wi="998" he="71" /></maths><maths num="0004"><math><![CDATA[<mrow><mover><mi>d</mi><mo>^</mo></mover><mo>=</mo><mi>w</mi><mo>+</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000875337110000014.GIF" wi="308" he="87" /></maths><img file="FDA0000875337110000015.GIF" wi="396" he="94" /><img file="FDA0000875337110000016.GIF" wi="51" he="78" />是等价干扰向量d的估计值,<img file="FDA0000875337110000017.GIF" wi="214" he="95" />分别是子系统中的等价干扰d<sub>1</sub>,...,d<sub>n</sub>的估计值,w∈R<sup>n</sup>是非线性干扰观测器的状态,p(x)∈R<sup>n</sup>是待设计的非线性函数向量,L(x)是非线性干扰观测器的增益矩阵,二者满足如下关系:<maths num="0005"><math><![CDATA[<mrow><mi>L</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><mfrac><mrow><mo>&part;</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow><mrow><mo>&part;</mo><mi>x</mi></mrow></mfrac><mo>=</mo><mi>d</mi><mi>i</mi><mi>a</mi><mi>g</mi><mo>{</mo><msub><mi>l</mi><mn>1</mn></msub><mo>,</mo><mo>...</mo><mo>,</mo><msub><mi>l</mi><mi>n</mi></msub><mo>}</mo></mrow>]]></math><img file="FDA0000875337110000021.GIF" wi="709" he="150" /></maths>l<sub>i</sub>,i=1,...,n是非线性干扰观测器的增益,diag{ }表示对角块,在干扰有界以及干扰变化率是慢时变的条件下,即<img file="FDA0000875337110000022.GIF" wi="133" he="71" />时,干扰观测器的估计误差方程可以表示为:<maths num="0006"><math><![CDATA[<mrow><mover><mi>e</mi><mo>&CenterDot;</mo></mover><mo>=</mo><mi>L</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>e</mi></mrow>]]></math><img file="FDA0000875337110000023.GIF" wi="241" he="70" /></maths>其中,估计误差向量<img file="FDA0000875337110000024.GIF" wi="237" he="79" />e=(e<sub>1</sub>,...,e<sub>n</sub>)<sup>T</sup>,估计误差<img file="FDA0000875337110000025.GIF" wi="523" he="94" />步骤3:将由非线性干扰观测器得到的等价干扰估计值代入指令滤波反步控制器中,构造抗干扰指令滤波反步控制器针对步骤1中建立的子系统描述形式Ξ<sub>1</sub>,为使子系统的状态变量x<sub>i</sub>在等价干扰d<sub>i</sub>存在的情况下能够渐进跟踪参考信号x<sub>i,c</sub>,即跟踪误差z<sub>i</sub>=x<sub>i</sub>‑x<sub>i,c</sub>渐进稳定,构造子系统的虚拟控制量为:<maths num="0007"><math><![CDATA[<mrow><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mfrac><mn>1</mn><mrow><msub><mi>g</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mfrac><mrow><mo>(</mo><mo>-</mo><msub><mi>c</mi><mi>i</mi></msub><msub><mi>z</mi><mi>i</mi></msub><mo>-</mo><msub><mi>f</mi><mi>i</mi></msub><mo>(</mo><mi>x</mi><mo>)</mo><mo>+</mo><msub><mover><mi>x</mi><mo>&CenterDot;</mo></mover><mrow><mi>i</mi><mo>,</mo><mi>c</mi></mrow></msub><mo>-</mo><msub><mi>g</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>(</mo><mi>x</mi><mo>)</mo><msub><mi>v</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>-</mo><msub><mover><mi>d</mi><mo>^</mo></mover><mi>i</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000875337110000026.GIF" wi="1078" he="158" /></maths>c<sub>i</sub>为虚拟控制量的增益,等价干扰d<sub>i</sub>的估计值<img file="FDA0000875337110000027.GIF" wi="62" he="94" />作为补偿项代入了虚拟控制量a<sub>i</sub>中,v<sub>i</sub>为补偿跟踪误差,x<sub>i,c</sub>和<img file="FDA0000875337110000028.GIF" wi="77" he="79" />为前一级子系统的虚拟控制量a<sub>i‑1</sub>经过指令滤波器Ξ<sub>3</sub>产生的输出,指令滤波器的状态空间和输出分别可以表示为:<maths num="0008"><math><![CDATA[<mrow><mi>&Xi;</mi><msub><malignmark/><mn>3</mn></msub><mo>:</mo><mrow><mo>{</mo><mrow><mtable><mtr><mtd><mrow><msub><mover><mi>q</mi><mo>&CenterDot;</mo></mover><mrow><mi>i</mi><mo>,</mo><mn>1</mn></mrow></msub><mo>=</mo><msub><mover><mi>q</mi><mo>&CenterDot;</mo></mover><mrow><mi>i</mi><mo>,</mo><mi>2</mi></mrow></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mover><mi>q</mi><mo>&CenterDot;</mo></mover><mrow><mi>i</mi><mo>,</mo><mi>2</mi></mrow></msub><mo>=</mo><mn>2</mn><msub><mi>&zeta;&omega;</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>S</mi><mrow><mi>i</mi><mo>,</mo><mi>V</mi></mrow></msub><mo>(</mo><mfrac><msubsup><mi>&omega;</mi><mi>i</mi><mn>2</mn></msubsup><mrow><mn>2</mn><msub><mi>&zeta;&omega;</mi><mi>i</mi></msub></mrow></mfrac><mo>(</mo><msub><mi>S</mi><mrow><mi>i</mi><mo>,</mo><mi>M</mi></mrow></msub><mo>(</mo><msub><mi>a</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>-</mo><msub><mi>q</mi><mrow><mi>i</mi><mo>,</mo><mn>1</mn></mrow></msub><mo>)</mo><mo>)</mo><mo>-</mo><msub><mi>q</mi><mrow><mi>i</mi><mo>,</mo><mn>2</mn></mrow></msub><mo>)</mo></mrow></mtd></mtr></mtable><mo>,</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>x</mi><mrow><mi>i</mi><mo>,</mo><mi>c</mi></mrow></msub><mo>=</mo><msub><mi>q</mi><mrow><mi>i</mi><mo>,</mo><mn>1</mn></mrow></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mover><mi>x</mi><mo>&CenterDot;</mo></mover><mrow><mi>i</mi><mo>,</mo><mi>c</mi></mrow></msub><mo>=</mo><msub><mi>q</mi><mrow><mi>i</mi><mo>,</mo><mn>2</mn></mrow></msub></mrow></mtd></mtr></mtable></mfenced></mrow></mrow></mrow>]]></math><img file="FDA0000875337110000029.GIF" wi="1461" he="269" /></maths>其中,q<sub>i,1</sub>和q<sub>i,2</sub>是指令滤波器的状态变量,ω<sub>i</sub>和ζ分别是指令滤波器的固有频率和阻尼比,ζ=0.707,S<sub>i,M</sub>( )和S<sub>i,V</sub>( )分别代表幅值和速率限制函数;经过逐步递推形成的虚拟控制量{a<sub>1</sub>,...,a<sub>n</sub>}的集合即组成抗干扰指令滤波反步控制器,系统的控制输入信号u=a<sub>n</sub>,x<sub>1,c</sub>和<img file="FDA00008753371100000210.GIF" wi="85" he="78" />为给定的参考输入指令,g<sub>0</sub>(x)=0、v<sub>0</sub>=0;补偿跟踪误差v<sub>i</sub>=z<sub>i</sub>‑ξ<sub>i</sub>,通过引入补偿量ξ<sub>i</sub>消除指令信号饱和对于跟踪误差的影响,ξ<sub>i</sub>的传递函数为<img file="FDA0000875337110000031.GIF" wi="646" he="156" />s表示复变量,对补偿跟踪误差求导,得到的补偿跟踪误差方程的向量形式为:<maths num="0009"><math><![CDATA[<mrow><mover><mi>v</mi><mo>&CenterDot;</mo></mover><mo>=</mo><mi>C</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>v</mi><mo>+</mo><mi>E</mi><mi>e</mi></mrow>]]></math><img file="FDA0000875337110000032.GIF" wi="366" he="68" /></maths>其中,<maths num="0010"><math><![CDATA[<mrow><mi>C</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msub><mfenced open = "(" close = ")"><mtable><mtr><mtd><mrow><mo>-</mo><msub><mi>c</mi><mn>1</mn></msub></mrow></mtd><mtd><mrow><msub><mi>g</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mtd><mtd><mrow></mrow></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><mrow><mo>-</mo><msub><mi>g</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mtd><mtd><mo>...</mo></mtd><mtd><mo>...</mo></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><mrow></mrow></mtd><mtd><mo>...</mo></mtd><mtd><mo>...</mo></mtd><mtd><mrow><msub><mi>g</mi><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow></mrow></mtd><mtd><mrow></mrow></mtd><mtd><mrow><mo>-</mo><msub><mi>g</mi><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mtd><mtd><mrow><mo>-</mo><msub><mi>c</mi><mi>n</mi></msub></mrow></mtd></mtr></mtable></mfenced><mrow><mi>n</mi><mo>&times;</mo><mi>n</mi></mrow></msub><mo>,</mo></mrow>]]></math><img file="FDA0000875337110000033.GIF" wi="1125" he="351" /></maths>矩阵中其他位置均为0元素,补偿跟踪误差向量v=(v<sub>1</sub>,...,v<sub>n</sub>)<sup>T</sup>,E为n×n维单位阵;步骤4:通过极点配置方法设计保证闭环复合误差系统渐近稳定的指令滤波反步控制器增益c<sub>i</sub>和非线性干扰观测器增益l<sub>i</sub>;将步骤3中指令滤波反步控制器的补偿跟踪误差方程<img file="FDA0000875337110000034.GIF" wi="363" he="79" />和步骤2中非线性干扰观测器的估计误差方程<img file="FDA0000875337110000035.GIF" wi="237" he="79" />联立得到闭环复合误差系统为:<maths num="0011"><math><![CDATA[<mrow><mfenced open = "(" close = ")"><mtable><mtr><mtd><mover><mi>v</mi><mo>&CenterDot;</mo></mover></mtd></mtr><mtr><mtd><mover><mi>e</mi><mo>&CenterDot;</mo></mover></mtd></mtr></mtable></mfenced><mo>=</mo><mfenced open = "(" close = ")"><mtable><mtr><mtd><mrow><mi>C</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mtd><mtd><mi>E</mi></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>L</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced><mfenced open = "(" close = ")"><mtable><mtr><mtd><mi>v</mi></mtd></mtr><mtr><mtd><mi>e</mi></mtd></mtr></mtable></mfenced><mo>,</mo><mi>A</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msub><mfenced open = "(" close = ")"><mtable><mtr><mtd><mrow><mi>C</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mtd><mtd><mi>E</mi></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>L</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced><mrow><mn>2</mn><mi>n</mi><mo>&times;</mo><mn>2</mn><mi>n</mi></mrow></msub></mrow>]]></math><img file="FDA0000875337110000036.GIF" wi="1270" he="182" /></maths>其中,A(x)为闭环复合误差系统的系统矩阵,用极点配置的方法通过将系统矩阵A(x)的特征根配置到复平面左半开平面[‑10,‑100]之间的区域,得到指令滤波反步控制器增益c<sub>i</sub>和非线性干扰观测器增益l<sub>i</sub>,此时系统矩阵A(x)对任意状态变量x∈R<sup>n</sup>,所有特征根都具有负实部,则可以保证闭环复合误差系统是渐进稳定的,即保证干扰估计误差e和补偿跟踪误差v渐进趋近于零,实现干扰渐进估计和状态渐进跟踪,达到系统的控制目标。
地址 100191 北京市海淀区学院路37号北京航空航天大学工程训练中心东213
您可能感兴趣的专利