发明名称 基于相关性分析的火电厂过程稳态建模变量筛选方法
摘要 基于相关性分析的火电厂过程稳态建模变量筛选方法,属于过程数据建模变量筛选技术领域。建立过程变量的历史数据的相关矩阵,对关注变量设置相关性偏置,修改相关矩阵中与对应变量相关的相关系数;对相关矩阵进行比较,形成由0和1构成的新的相关矩阵,0代表两个变量相关性弱,1代表两个变量相关性强;调整变量的次序,使得相关矩阵中彼此相关系数大的变量前后紧密排列,新的变量列表对应的相关矩阵形成分块矩阵的形态,不同子块对应的变量分开建模,同一子块对应的变量作为建模变量进行建模。本发明根据过程变量间的相关性对过程变量进行分组,避免经验不同对结果的影响,简化建模过程中变量选取工作,提高所建模型对实际过程的描述能力。
申请公布号 CN103413052B 申请公布日期 2016.02.24
申请号 CN201310367445.9 申请日期 2013.08.21
申请人 华北电力大学 发明人 邱天;杨婷婷;牛玉广;曾德良;刘吉臻
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 北京众合诚成知识产权代理有限公司 11246 代理人 薄观玖
主权项 基于相关性分析的火电厂过程稳态建模变量筛选方法,其特征在于,该方法包括如下步骤:步骤一、建立过程变量的历史数据的相关矩阵以稳定工况为判断准则采集火电厂稳定过程的历史数据,将历史数据放入二维矩阵X<sub>m×n</sub>中,其中m是历史数据的组数,n是过程变量个数;然后计算矩阵X<sub>m×n</sub>对应的相关矩阵R,其组成元素r<sub>ij</sub>为对应变量x<sub>i</sub>和变量x<sub>j</sub>间的相关系数,<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>r</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mfrac><mrow><mi>c</mi><mi>o</mi><mi>v</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>,</mo><msub><mi>x</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><msqrt><mrow><msub><mi>&sigma;</mi><mi>i</mi></msub><msub><mi>&sigma;</mi><mi>j</mi></msub></mrow></msqrt></mfrac><mo>,</mo></mrow>]]></math><img file="FDA0000858873770000011.GIF" wi="396" he="138" /></maths>其中,cov(x<sub>i</sub>,x<sub>j</sub>)为变量x<sub>i</sub>和x<sub>j</sub>间的协方差系数,σ<sub>i</sub>和σ<sub>j</sub>分别为变量x<sub>i</sub>和x<sub>j</sub>的标准差;对过程的重要变量可设置相关性偏置p=[p<sub>1</sub>,p<sub>2</sub>,...,p<sub>n</sub>],偏置量值的取值范围[0,1],构造偏置矩阵Δ;对第i个变量x<sub>i</sub>,若p<sub>i</sub>≠0则Δ<sub>i</sub>中的元素δ<sub>i,1</sub>,...,δ<sub>i,n</sub>,δ<sub>1,i</sub>,...,δ<sub>n,i</sub>设为p<sub>i</sub>;将偏置矩阵Δ<sub>i</sub>叠加在相关矩阵中与对应变量相关的相关系数上;计算过程中相关系数超出1则取1;步骤二、选取阈值δ以区分变量相关性的强弱,作为变量分组的基础;定义根据阈值判断相关性强弱的函数<img file="FDA0000858873770000012.GIF" wi="175" he="70" /><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>f</mi><mrow><mo>(</mo><msubsup><mi>r</mi><mrow><mi>i</mi><mi>j</mi></mrow><mrow><mi>n</mi><mi>e</mi><mi>w</mi></mrow></msubsup><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><mo>|</mo><msub><mi>r</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>|</mo><mo>&GreaterEqual;</mo><mi>&delta;</mi></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mo>|</mo><msub><mi>r</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>|</mo><mo>&lt;</mo><mi>&delta;</mi></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000858873770000013.GIF" wi="572" he="167" /></maths>其中,0代表两个变量相关性弱,1代表两个变量相关性强;采用<img file="FDA0000858873770000014.GIF" wi="166" he="70" />对步骤一中得到的相关矩阵进行计算,用计算结果替换对应的相关系数,形成由0和1构成的新的相关矩阵R<sup>new</sup>;步骤三、调整变量的次序,使得相关矩阵中彼此相关系数大的变量前后紧密排列,新的变量列表对应的相关矩阵形成分块矩阵的形态,不同子块对应的变量分开建模,同一子块对应的变量作为建模变量进行建模;分组的方法是通过改变测量向量相关矩阵中测量变量的顺序,使得相关矩阵中各个元素按照相关性形成独自的区块;这里对测量变量的相关矩阵联合使用矩阵的行变换和列变换,保证相关矩阵的对称性;在进行相关矩阵变换时,尽量使得较大的元素接近于矩阵的对角线;这一目标可以通过最小化下面的指标得到:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mi>V</mi></munder><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mi>f</mi><mrow><mo>(</mo><msubsup><mi>r</mi><mrow><mi>i</mi><mi>j</mi></mrow><mrow><mi>n</mi><mi>e</mi><mi>w</mi></mrow></msubsup><mo>)</mo></mrow><mo>|</mo><mi>i</mi><mo>-</mo><mi>j</mi><mo>|</mo><mo>,</mo></mrow>]]></math><img file="FDA0000858873770000015.GIF" wi="588" he="162" /></maths>其中,<img file="FDA0000858873770000016.GIF" wi="108" he="69" />为矩阵R<sup>new</sup>=V<sup>T</sup>RV中的元素;R为矩阵X<sub>m×n</sub>对应的相关矩阵,矩阵V表示一系列矩阵列交换的组合,为了保持R<sup>new</sup>的对称性,列交换的操作应用于R的两侧;V=ΠS<sub>ij</sub>其中,S<sub>ij</sub>为第i列和第j列互换的单位矩阵:S<sub>ij</sub>=[ξ<sub>1</sub> ... ξ<sub>i‑1</sub> ξ<sub>j</sub> ξ<sub>i+1</sub> ... ξ<sub>j‑1</sub> ξ<sub>i</sub> ξ<sub>i+1</sub> ... ξ<sub>m</sub>]其中,ξ<sub>i</sub>表示第i位为1,其它位置为0的向量;得到的最终结果为按照最优原则下的变量相关分块矩阵,其中每块对应一组变量。
地址 102206 北京市昌平区朱辛庄北农路2号