基于协同进化算法的调频反馈纳什均衡控制方法,申请号CN201310134921.2-传众专利搜索

发明名称	基于协同进化算法的调频反馈纳什均衡控制方法
摘要	本发明公开了基于协同进化算法的调频反馈纳什均衡控制方法，包括步骤包括：步骤1、考虑调速器死区、控制动作幅值限制、机组爬坡速率约束等工程实际因素，建立IEEE两区域互联系统中一、二次调频间的微分博弈模型；步骤2、采用协同进化算法求解带有各种复杂约束的一、二次调频间的微分博弈模型，求得其反馈纳什均衡解；步骤3、将求得的反馈纳什均衡策略作为区域的一、二次调频控制量，有效解决了一、二次调频间的冲突反调问题，从而实现了电力系统一、二次调频间的协调控制。具有减少了机组损耗量，获得了良好的控制效果等优点。
申请公布号	CN103441492B	申请公布日期	2016.02.24
申请号	CN201310134921.2	申请日期	2013.04.18
申请人	海南电网公司;华南理工大学	发明人	陈皓勇;卢润戈;叶荣;魏国清;黄良毅;吴锋
分类号	H02J3/00(2006.01)I;G06Q50/06(2012.01)I	主分类号	H02J3/00(2006.01)I
代理机构	广州市华学知识产权代理有限公司 44245	代理人	蔡茂略
主权项	基于协同进化算法的调频反馈纳什均衡控制方法，其特征在于，包括步骤包括：步骤1、建立两区域互联系统中的一、二次调频间的微分博弈模型，所述两区域互联系统包括区域1和区域2；步骤2、定义负荷跳变后的所述的两区域互联系统的状态；步骤3、采用协同进化算法求解所述一、二次调频间的微分博弈模型，求得所述一、二次调频间的微分博弈模型的反馈纳什均衡解；步骤4、将步骤3求得的所述反馈纳什均衡解作为区域1的一、二次调频控制量；所述步骤3包括以下步骤：1)所述区域1的一次调频和二次调频以状态变量的线性反馈系数k为变量；区域1的一次调频和二次调频均采用遗传算法来求解，所述遗传算法的计算方法为：给区域1的一次调频和二次调频设置用于遗传算法的两个种群，所述两个种群为种群pop<sub>1</sub>和种群pop<sub>2</sub>，所述种群pop<sub>1</sub>和种群pop<sub>2</sub>均由若干个染色体组成，每个所述染色体为区域1的一次调频和二次调频的状态变量的线性反馈系数k的一个随机样本；2)假设协同进化算法进化至第L代，所述pop<sub>1</sub>和pop<sub>2</sub>在协同机制下进化，将步骤c所述的系统状态方程作为联系种群pop<sub>1</sub>和种群pop<sub>2</sub>的枢纽，将所述区域1的一次调频和二次调频支付函数的倒数1/J<sub>i</sub>作为染色体的适应度值；对种群pop<sub>1</sub>执行以下操作：选择将种群pop<sub>2</sub>在第L‑1代适应度值最大的染色体所对应的策略<img file="FDA0000831927630000011.GIF" wi="85" he="85" />作为代表策略；种群pop<sub>1</sub>中每一条染色体对应策略<img file="FDA0000831927630000012.GIF" wi="76" he="90" />与种群pop<sub>2</sub>的代表策略<img file="FDA0000831927630000013.GIF" wi="141" he="95" />令<img file="FDA0000831927630000014.GIF" wi="679" he="95" />并将u<sub>1</sub>,u<sub>2</sub>代入系统状态方程求出系统状态轨迹，将区域1的一次调频的支付函数倒数1/J<sub>1</sub>设置为染色体的适应度值，种群pop<sub>1</sub>中的每个染色体均具有一个适应度值，所述适应度值作为遗传算法的选择操作的依据，选取种群pop<sub>1</sub>中染色体的适应度值最大的染色体<img file="FDA0000831927630000015.GIF" wi="107" he="87" />作为种群pop<sub>1</sub>的代表策略，所述种群pop<sub>1</sub>的代表策略单独对种群pop<sub>1</sub>进行遗传算法的选择操作、交叉操作和变异操作；对种群pop<sub>2</sub>做以下操作:选择将种群pop<sub>1</sub>在第L‑1代适应度值最大的染色体所对应的策略<img file="FDA0000831927630000021.GIF" wi="89" he="78" />作为代表策略；种群pop<sub>2</sub>中每一条染色体对应策略<img file="FDA0000831927630000022.GIF" wi="76" he="90" />与种群pop<sub>1</sub>的代表策略<img file="FDA0000831927630000023.GIF" wi="141" he="114" />令<img file="FDA0000831927630000024.GIF" wi="735" he="116" />并将u<sub>1</sub>,u<sub>2</sub>代入系统状态方程求出系统状态轨迹，将区域1的二次调频的支付函数倒数1/J<sub>2</sub>设置为该染色体的适应度，种群pop<sub>2</sub>中每个染色体均具有一个适应度值，所述适应度值作为遗传算法的选择操作的依据，选取种群pop<sub>2</sub>中染色体的适应度值最大的染色体<img file="FDA0000831927630000025.GIF" wi="112" he="96" />作为种群pop<sub>2</sub>的代表策略，所述种群pop<sub>2</sub>的代表策略单独对种群pop<sub>2</sub>进行遗传算法的选择操作、交叉操作和变异操作；3)重复步骤2)，使种群pop<sub>1</sub>和种群pop<sub>2</sub>都实现进化；4)重复步骤2)到3)，直到所述协同进化算法收敛为止；5)把步骤1)至4)求得的种群pop<sub>1</sub>和种群pop<sub>2</sub>的代表策略<img file="FDA0000831927630000026.GIF" wi="108" he="87" />和<img file="FDA0000831927630000027.GIF" wi="92" he="90" />组成微分博弈的反馈纳什均衡策略，所述反馈纳什均衡策略的表达式为：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>u</mi><mn>1</mn><mo></mo></msubsup><mo>=</mo><msubsup><mi>k</mi><mn>1</mn><mrow><mi>b</mi><mi>e</mi><mi>s</mi><mi>t</mi></mrow></msubsup><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>,</mo><msubsup><mi>u</mi><mn>2</mn><mo></mo></msubsup><mo>=</mo><msubsup><mi>k</mi><mn>2</mn><mrow><mi>b</mi><mi>e</mi><mi>s</mi><mi>t</mi></mrow></msubsup><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000831927630000028.GIF" wi="666" he="82" /></maths>其中，<img file="FDA0000831927630000029.GIF" wi="59" he="76" />为区域1的一次调频的反馈纳什均衡策略，<img file="FDA00008319276300000210.GIF" wi="61" he="83" />区域1的二次调频的反馈纳什均衡策略；把所述反馈纳什均衡策略作为区域1的一次调频控制量u<sub>1</sub>和二次调频控制量u<sub>2</sub>；u<sub>1</sub>,u<sub>2</sub>分别为区域1的一次调频控制量和二次调频控制量；所述步骤c中的系统状态方程具体为：<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mover><mi>x</mi><mo>·</mo></mover><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mi>A</mi><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>1</mn></msub><msub><mi>u</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>2</mn></msub><msub><mi>u</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>ΓΔP</mi><mi>L</mi></msub><mo>,</mo></mrow>]]></math><img file="FDA00008319276300000211.GIF" wi="829" he="87" /></maths>其中，u<sub>1</sub>,u<sub>2</sub>分别为区域1的一次调频控制量和二次调频控制量，它们由微分博弈控制器求解得到；ΔP<sub>L</sub>＝[ΔP<sub>L1</sub> ΔP<sub>L2</sub>]<sup>T</sup>为负荷扰动量；A为系统状态矩阵，B<sub>i</sub>为输入矩阵，Γ为扰动转移矩阵，A、B<sub>i</sub>、Γ的值可根据系统动态计算得到；将区域1的一、二次调频双方的支付函数设置为线性二次型：i＝(1,2)<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>J</mi><mi>i</mi></msub><mo>=</mo><mrow><msubsup><mo>&Integral;</mo><msub><mi>t</mi><mn>0</mn></msub><mi>∞</mi></msubsup><mrow><mfrac><mn>1</mn><mn>2</mn></mfrac><mrow><mo>[</mo><mrow><msup><mi>x</mi><mrow><mn>1</mn><mi>T</mi></mrow></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msub><mi>Q</mi><mi>i</mi></msub><msup><mi>x</mi><mn>1</mn></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msup><msub><mi>u</mi><mi>i</mi></msub><mrow><mn>1</mn><mi>T</mi></mrow></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msub><mi>R</mi><mi>i</mi></msub><msup><msub><mi>u</mi><mi>i</mi></msub><mn>1</mn></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>]</mo></mrow><mi>d</mi><mi>t</mi></mrow></mrow><mo>,</mo></mrow>]]></math><img file="FDA00008319276300000212.GIF" wi="948" he="124" /></maths><maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msup><mover><mi>x</mi><mo>·</mo></mover><mn>1</mn></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>Ax</mi><mn>1</mn></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>1</mn></msub><msub><msup><mi>u</mi><mn>1</mn></msup><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>2</mn></msub><msub><msup><mi>u</mi><mn>1</mn></msup><mn>2</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA00008319276300000213.GIF" wi="691" he="81" /></maths>支付函数J<sub>i</sub>定义为线性二次型形式，Q<sub>i</sub>、R<sub>i</sub>分别为状态量和输入量的权系数矩阵，x<sup>1T</sup>(t)为x<sup>1</sup>(t)的转置矩阵，u<sub>i</sub><sup>1T</sup>(t)为u<sub>i</sub><sup>1</sup>(t)的转置矩阵，x<sup>1</sup>(t)为定义后的系统状态量，A为系统状态矩阵，B<sub>i</sub>为输入矩阵，B<sub>1</sub>和B<sub>2</sub>分别为i的取值为1和2时的输入矩阵；系统的状态变量为：x(t)＝[Δf<sub>1</sub> ΔP<sub>g1</sub> ΔX<sub>g1</sub> Δf<sub>2</sub> ΔP<sub>g2</sub> ΔX<sub>g2</sub> ΔP<sub>c2</sub> ΔP<sub>tie</sub>]<sup>T</sup>，其中，对于区域i，Δf<sub>i</sub>为瞬时频率与额定值的偏差，ΔP<sub>gi</sub>为原动机出力变化量，ΔX<sub>gi</sub>为调速器阀门位置改变量，ΔP<sub>tie</sub>为联络线交换功率偏差；ΔP<sub>c2</sub>为区域2的二次调频控制量；所述步骤1中，建立两区域互联系统中的一、二次调频间的微分博弈模型的步骤为：a.采用微分博弈控制器求取所述区域1的一次调频控制量和二次调频控制量的大小，对所述区域2采用比例积分控制方式；b.选择系统的状态变量为：x(t)＝[Δf<sub>1</sub> ΔP<sub>g1</sub> ΔX<sub>g1</sub> Δf<sub>2</sub> ΔP<sub>g2</sub> ΔX<sub>g2</sub> ΔP<sub>c2</sub> ΔP<sub>tie</sub>]<sup>T</sup>，其中，对于区域i，Δf<sub>i</sub>分别为瞬时频率与额定值的偏差，ΔP<sub>gi</sub>为原动机出力变化量，ΔX<sub>gi</sub>为调速器阀门位置改变量，ΔP<sub>tie</sub>为联络线交换功率偏差；ΔP<sub>c2</sub>为区域2的二次调频控制量；c.通过分析计算得到系统状态方程：<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mover><mi>x</mi><mo>·</mo></mover><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mi>A</mi><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>1</mn></msub><msub><mi>u</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>B</mi><mn>2</mn></msub><msub><mi>u</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>ΓΔP</mi><mi>L</mi></msub><mo>,</mo></mrow>]]></math><img file="FDA0000831927630000031.GIF" wi="829" he="83" /></maths>其中，u<sub>1</sub>,u<sub>2</sub>分别为区域1的一次调频控制量和二次调频控制量，它们由微分博弈控制器求解得到；ΔP<sub>L</sub>＝[ΔP<sub>L1</sub> ΔP<sub>L2</sub>]<sup>T</sup>为负荷扰动量；A为系统状态矩阵，B<sub>i</sub>为输入矩阵，Γ为扰动转移矩阵，A、B<sub>i</sub>、Γ的值可根据系统动态计算得到。
地址	570203 海南省海口市海府路34号