发明名称 基于协同进化算法的调频反馈纳什均衡控制方法
摘要 本发明公开了基于协同进化算法的调频反馈纳什均衡控制方法,包括步骤包括:步骤1、考虑调速器死区、控制动作幅值限制、机组爬坡速率约束等工程实际因素,建立IEEE两区域互联系统中一、二次调频间的微分博弈模型;步骤2、采用协同进化算法求解带有各种复杂约束的一、二次调频间的微分博弈模型,求得其反馈纳什均衡解;步骤3、将求得的反馈纳什均衡策略作为区域的一、二次调频控制量,有效解决了一、二次调频间的冲突反调问题,从而实现了电力系统一、二次调频间的协调控制。具有减少了机组损耗量,获得了良好的控制效果等优点。
申请公布号 CN103441492B 申请公布日期 2016.02.24
申请号 CN201310134921.2 申请日期 2013.04.18
申请人 海南电网公司;华南理工大学 发明人 陈皓勇;卢润戈;叶荣;魏国清;黄良毅;吴锋
分类号 H02J3/00(2006.01)I;G06Q50/06(2012.01)I 主分类号 H02J3/00(2006.01)I
代理机构 广州市华学知识产权代理有限公司 44245 代理人 蔡茂略
主权项 基于协同进化算法的调频反馈纳什均衡控制方法,其特征在于,包括步骤包括:步骤1、建立两区域互联系统中的一、二次调频间的微分博弈模型,所述两区域互联系统包括区域1和区域2;步骤2、定义负荷跳变后的所述的两区域互联系统的状态;步骤3、采用协同进化算法求解所述一、二次调频间的微分博弈模型,求得所述一、二次调频间的微分博弈模型的反馈纳什均衡解;步骤4、将步骤3求得的所述反馈纳什均衡解作为区域1的一、二次调频控制量;所述步骤3包括以下步骤:1)所述区域1的一次调频和二次调频以状态变量的线性反馈系数k为变量;区域1的一次调频和二次调频均采用遗传算法来求解,所述遗传算法的计算方法为:给区域1的一次调频和二次调频设置用于遗传算法的两个种群,所述两个种群为种群pop<sub>1</sub>和种群pop<sub>2</sub>,所述种群pop<sub>1</sub>和种群pop<sub>2</sub>均由若干个染色体组成,每个所述染色体为区域1的一次调频和二次调频的状态变量的线性反馈系数k的一个随机样本;2)假设协同进化算法进化至第L代,所述pop<sub>1</sub>和pop<sub>2</sub>在协同机制下进化,将步骤c所述的系统状态方程作为联系种群pop<sub>1</sub>和种群pop<sub>2</sub>的枢纽,将所述区域1的一次调频和二次调频支付函数的倒数1/J<sub>i</sub>作为染色体的适应度值;对种群pop<sub>1</sub>执行以下操作:选择将种群pop<sub>2</sub>在第L‑1代适应度值最大的染色体所对应的策略<img file="FDA0000831927630000011.GIF" wi="85" he="85" />作为代表策略;种群pop<sub>1</sub>中每一条染色体对应策略<img file="FDA0000831927630000012.GIF" wi="76" he="90" />与种群pop<sub>2</sub>的代表策略<img file="FDA0000831927630000013.GIF" wi="141" he="95" />令<img file="FDA0000831927630000014.GIF" wi="679" he="95" />并将u<sub>1</sub>,u<sub>2</sub>代入系统状态方程求出系统状态轨迹,将区域1的一次调频的支付函数倒数1/J<sub>1</sub>设置为染色体的适应度值,种群pop<sub>1</sub>中的每个染色体均具有一个适应度值,所述适应度值作为遗传算法的选择操作的依据,选取种群pop<sub>1</sub>中染色体的适应度值最大的染色体<img file="FDA0000831927630000015.GIF" wi="107" he="87" />作为种群pop<sub>1</sub>的代表策略,所述种群pop<sub>1</sub>的代表策略单独对种群pop<sub>1</sub>进行遗传算法的选择操作、交叉操作和变异操作;对种群pop<sub>2</sub>做以下操作:选择将种群pop<sub>1</sub>在第L‑1代适应度值最大的染色体所对应的策略<img file="FDA0000831927630000021.GIF" wi="89" he="78" />作为代表策略;种群pop<sub>2</sub>中每一条染色体对应策略<img file="FDA0000831927630000022.GIF" wi="76" he="90" />与种群pop<sub>1</sub>的代表策略<img file="FDA0000831927630000023.GIF" wi="141" he="114" />令<img file="FDA0000831927630000024.GIF" wi="735" he="116" />并将u<sub>1</sub>,u<sub>2</sub>代入系统状态方程求出系统状态轨迹,将区域1的二次调频的支付函数倒数1/J<sub>2</sub>设置为该染色体的适应度,种群pop<sub>2</sub>中每个染色体均具有一个适应度值,所述适应度值作为遗传算法的选择操作的依据,选取种群pop<sub>2</sub>中染色体的适应度值最大的染色体<img file="FDA0000831927630000025.GIF" wi="112" he="96" />作为种群pop<sub>2</sub>的代表策略,所述种群pop<sub>2</sub>的代表策略单独对种群pop<sub>2</sub>进行遗传算法的选择操作、交叉操作和变异操作;3)重复步骤2),使种群pop<sub>1</sub>和种群pop<sub>2</sub>都实现进化;4)重复步骤2)到3),直到所述协同进化算法收敛为止;5)把步骤1)至4)求得的种群pop<sub>1</sub>和种群pop<sub>2</sub>的代表策略<img file="FDA0000831927630000026.GIF" wi="108" he="87" />和<img file="FDA0000831927630000027.GIF" wi="92" he="90" />组成微分博弈的反馈纳什均衡策略,所述反馈纳什均衡策略的表达式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>u</mi><mn>1</mn><mo>*</mo></msubsup><mo>=</mo><msubsup><mi>k</mi><mn>1</mn><mrow><mi>b</mi><mi>e</mi><mi>s</mi><mi>t</mi></mrow></msubsup><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>,</mo><msubsup><mi>u</mi><mn>2</mn><mo>*</mo></msubsup><mo>=</mo><msubsup><mi>k</mi><mn>2</mn><mrow><mi>b</mi><mi>e</mi><mi>s</mi><mi>t</mi></mrow></msubsup><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000831927630000028.GIF" wi="666" he="82" /></maths>其中,<img file="FDA0000831927630000029.GIF" wi="59" he="76" />为区域1的一次调频的反馈纳什均衡策略,<img file="FDA00008319276300000210.GIF" wi="61" he="83" />区域1的二次调频的反馈纳什均衡策略;把所述反馈纳什均衡策略作为区域1的一次调频控制量u<sub>1</sub>和二次调频控制量u<sub>2</sub>;u<sub>1</sub>,u<sub>2</sub>分别为区域1的一次调频控制量和二次调频控制量;所述步骤c中的系统状态方程具体为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mover><mi>x</mi><mo>&CenterDot;</mo></mover><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mi>A</mi><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>1</mn></msub><msub><mi>u</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>2</mn></msub><msub><mi>u</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>&Gamma;&Delta;P</mi><mi>L</mi></msub><mo>,</mo></mrow>]]></math><img file="FDA00008319276300000211.GIF" wi="829" he="87" /></maths>其中,u<sub>1</sub>,u<sub>2</sub>分别为区域1的一次调频控制量和二次调频控制量,它们由微分博弈控制器求解得到;ΔP<sub>L</sub>=[ΔP<sub>L1</sub> ΔP<sub>L2</sub>]<sup>T</sup>为负荷扰动量;A为系统状态矩阵,B<sub>i</sub>为输入矩阵,Γ为扰动转移矩阵,A、B<sub>i</sub>、Γ的值可根据系统动态计算得到;将区域1的一、二次调频双方的支付函数设置为线性二次型:i=(1,2)<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>J</mi><mi>i</mi></msub><mo>=</mo><mrow><msubsup><mo>&Integral;</mo><msub><mi>t</mi><mn>0</mn></msub><mi>&infin;</mi></msubsup><mrow><mfrac><mn>1</mn><mn>2</mn></mfrac><mrow><mo>&lsqb;</mo><mrow><msup><mi>x</mi><mrow><mn>1</mn><mi>T</mi></mrow></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msub><mi>Q</mi><mi>i</mi></msub><msup><mi>x</mi><mn>1</mn></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msup><msub><mi>u</mi><mi>i</mi></msub><mrow><mn>1</mn><mi>T</mi></mrow></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msub><mi>R</mi><mi>i</mi></msub><msup><msub><mi>u</mi><mi>i</mi></msub><mn>1</mn></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&rsqb;</mo></mrow><mi>d</mi><mi>t</mi></mrow></mrow><mo>,</mo></mrow>]]></math><img file="FDA00008319276300000212.GIF" wi="948" he="124" /></maths><maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msup><mover><mi>x</mi><mo>&CenterDot;</mo></mover><mn>1</mn></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>Ax</mi><mn>1</mn></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>1</mn></msub><msub><msup><mi>u</mi><mn>1</mn></msup><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>2</mn></msub><msub><msup><mi>u</mi><mn>1</mn></msup><mn>2</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA00008319276300000213.GIF" wi="691" he="81" /></maths>支付函数J<sub>i</sub>定义为线性二次型形式,Q<sub>i</sub>、R<sub>i</sub>分别为状态量和输入量的权系数矩阵,x<sup>1T</sup>(t)为x<sup>1</sup>(t)的转置矩阵,u<sub>i</sub><sup>1T</sup>(t)为u<sub>i</sub><sup>1</sup>(t)的转置矩阵,x<sup>1</sup>(t)为定义后的系统状态量,A为系统状态矩阵,B<sub>i</sub>为输入矩阵,B<sub>1</sub>和B<sub>2</sub>分别为i的取值为1和2时的输入矩阵;系统的状态变量为:x(t)=[Δf<sub>1</sub> ΔP<sub>g1</sub> ΔX<sub>g1</sub> Δf<sub>2</sub> ΔP<sub>g2</sub> ΔX<sub>g2</sub> ΔP<sub>c2</sub> ΔP<sub>tie</sub>]<sup>T</sup>,其中,对于区域i,Δf<sub>i</sub>为瞬时频率与额定值的偏差,ΔP<sub>gi</sub>为原动机出力变化量,ΔX<sub>gi</sub>为调速器阀门位置改变量,ΔP<sub>tie</sub>为联络线交换功率偏差;ΔP<sub>c2</sub>为区域2的二次调频控制量;所述步骤1中,建立两区域互联系统中的一、二次调频间的微分博弈模型的步骤为:a.采用微分博弈控制器求取所述区域1的一次调频控制量和二次调频控制量的大小,对所述区域2采用比例积分控制方式;b.选择系统的状态变量为:x(t)=[Δf<sub>1</sub> ΔP<sub>g1</sub> ΔX<sub>g1</sub> Δf<sub>2</sub> ΔP<sub>g2</sub> ΔX<sub>g2</sub> ΔP<sub>c2</sub> ΔP<sub>tie</sub>]<sup>T</sup>,其中,对于区域i,Δf<sub>i</sub>分别为瞬时频率与额定值的偏差,ΔP<sub>gi</sub>为原动机出力变化量,ΔX<sub>gi</sub>为调速器阀门位置改变量,ΔP<sub>tie</sub>为联络线交换功率偏差;ΔP<sub>c2</sub>为区域2的二次调频控制量;c.通过分析计算得到系统状态方程:<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mover><mi>x</mi><mo>&CenterDot;</mo></mover><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mi>A</mi><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>1</mn></msub><msub><mi>u</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>2</mn></msub><msub><mi>u</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>&Gamma;&Delta;P</mi><mi>L</mi></msub><mo>,</mo></mrow>]]></math><img file="FDA0000831927630000031.GIF" wi="829" he="83" /></maths>其中,u<sub>1</sub>,u<sub>2</sub>分别为区域1的一次调频控制量和二次调频控制量,它们由微分博弈控制器求解得到;ΔP<sub>L</sub>=[ΔP<sub>L1</sub> ΔP<sub>L2</sub>]<sup>T</sup>为负荷扰动量;A为系统状态矩阵,B<sub>i</sub>为输入矩阵,Γ为扰动转移矩阵,A、B<sub>i</sub>、Γ的值可根据系统动态计算得到。
地址 570203 海南省海口市海府路34号