发明名称 从高维非对称数据中提取分类信息的方法
摘要 本发明涉及信号与图像处理领域,提供一种从高维非对称数据中提取分类信息的方法,以解决现有相关分类信息提取方法要么不适合样本不对称的数据,要么计算复杂高、处理高维数据时容易发生计算量溢出的问题,该方法包括:获取高维非对称数据;对Σ<sub>o</sub>和Σ<sub>c</sub>赋以新的权重,组成新的协方差矩阵Σ<sub>α</sub>代替Σ<sub>t</sub>进行特征分解,求解其特征值和特征向量;组合得到降维矩阵,将高维非对称数据通过降维矩阵进行投影得到降维后的分类信息。本发明提出的技术方案计算复杂度低、准确性高、运行速度快、稳定性好。
申请公布号 CN105005783A 申请公布日期 2015.10.28
申请号 CN201510251168.4 申请日期 2015.05.18
申请人 电子科技大学 发明人 刘丁赟;饶妮妮;刘汉明;郑洁;黎桑;曾伟
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 四川省成都市天策商标专利事务所 51213 代理人 罗韬
主权项 一种从高维非对称数据中提取分类信息的方法,其特征在于包括如下步骤:步骤A:获取高维非对称数据,所述高维非对称数据由阳性样本和阴性样本组成,分析得到所述高维非对称数据的维度n、所述高维非对称数据的总样本数量q、所述阳性样本的样本数量q<sub>o</sub>、所述阴性样本的样本数量q<sub>c</sub>,设置待提取的分类信息的维数m;步骤B:计算高维非对称样本数据的均值向量M、阳性类样本的均值向量M<sub>o</sub>、阴性类样本的均值向量M<sub>c</sub>,分别中心化阳性样本和阴性样本得到中心化后的阳性样本集合矩阵S<sub>o</sub>、中心化后的阴性样本集合矩阵S<sub>c</sub>;步骤C:分别构建矩阵X<sub>o</sub>、矩阵X<sub>c</sub>、矩阵X<sub>mo</sub>、矩阵X<sub>mc</sub>,其中<img file="FDA0000718717030000011.GIF" wi="400" he="95" />α<sub>o</sub>=q<sub>c</sub>/q、<maths id="cmaths0001" num="0001"><math><![CDATA[<mrow><msub><mi>X</mi><mi>c</mi></msub><mo>=</mo><msqrt><msub><mi>&alpha;</mi><mi>c</mi></msub><mo>/</mo><msub><mi>q</mi><mi>c</mi></msub></msqrt><msub><mi>S</mi><mi>c</mi></msub><mo>,</mo></mrow>]]></math><img file="FDA0000718717030000012.GIF" wi="390" he="98" /></maths>α<sub>c</sub>=q<sub>o</sub>/q、<maths id="cmaths0002" num="0002"><math><![CDATA[<mrow><msub><mi>X</mi><mi>mo</mi></msub><mo>=</mo><msqrt><msub><mi>&alpha;</mi><mi>c</mi></msub></msqrt><mrow><mo>(</mo><msub><mi>M</mi><mi>o</mi></msub><mo>-</mo><mi>M</mi><mo>)</mo></mrow><mo>,</mo><msub><mi>X</mi><mi>mc</mi></msub><mo>=</mo><msqrt><msub><mi>&alpha;</mi><mi>o</mi></msub></msqrt><msqrt><msub><mi>M</mi><mi>c</mi></msub><mo>-</mo><mi>M</mi></msqrt><mo>;</mo></mrow>]]></math><img file="FDA0000718717030000013.GIF" wi="1019" he="96" /></maths>步骤D:计算矩阵X<sub>o</sub><sup>T</sup>X<sub>o</sub>的非零特征值<img file="FDA0000718717030000014.GIF" wi="138" he="104" />和对应的特征向量<img file="FDA0000718717030000015.GIF" wi="166" he="104" />矩阵X<sub>c</sub><sup>T</sup>X<sub>c</sub>的非零特征值<img file="FDA0000718717030000016.GIF" wi="148" he="104" />和对应的特征向量<img file="FDA0000718717030000017.GIF" wi="173" he="104" />X<sub>mo</sub><sup>T</sup>X<sub>mo</sub>的特征值λ<sub>mo</sub>和对应的特征向量u<sub>mo</sub>、矩阵X<sub>mc</sub><sup>T</sup>X<sub>mc</sub>的特征值λ<sub>mc</sub>和对应的特征向量u<sub>mc</sub>;步骤E:根据步骤D中得到的特征向量拼凑出对角化矩阵U和对角阵Λ,并构建矩阵<img file="FDA0000718717030000018.GIF" wi="125" he="79" />其中<maths id="cmaths0003" num="0003"><math><![CDATA[<mrow><mi>U</mi><mo>=</mo><mo>[</mo><msubsup><mi>u</mi><mi>o</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>u</mi><mi>o</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>u</mi><mi>o</mi><mrow><mo>(</mo><msub><mi>q</mi><mi>o</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>u</mi><mi>c</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>u</mi><mi>c</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>u</mi><mi>c</mi><mrow><mo>(</mo><msub><mi>q</mi><mi>c</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msub><mi>u</mi><mi>mo</mi></msub><mo>,</mo><msub><mi>u</mi><mi>mo</mi></msub><mo>]</mo><mo>,</mo></mrow>]]></math><img file="FDA0000718717030000019.GIF" wi="1190" he="89" /></maths><maths id="cmaths0004" num="0004"><math><![CDATA[<mrow><mi>&Lambda;</mi><mo>=</mo><mi>diag</mi><mrow><mo>(</mo><msubsup><mi>&lambda;</mi><mi>o</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>&lambda;</mi><mi>o</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>&lambda;</mi><mi>o</mi><mrow><mo>(</mo><msub><mi>q</mi><mi>o</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>&lambda;</mi><mi>c</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>&lambda;</mi><mi>c</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>&lambda;</mi><mi>c</mi><mrow><mo>(</mo><msub><mi>q</mi><mi>c</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msub><mi>&lambda;</mi><mi>mo</mi></msub><mo>,</mo><msub><mi>&lambda;</mi><mi>mc</mi></msub><mo>)</mo></mrow><mo>,</mo><mover><mi>X</mi><mo>^</mo></mover><mo>=</mo><msqrt><mi>&Lambda;</mi></msqrt><msup><mi>U</mi><mi>T</mi></msup><mo>;</mo></mrow>]]></math><img file="FDA00007187170300000110.GIF" wi="1617" he="103" /></maths>步骤F:计算矩阵<img file="FDA00007187170300000111.GIF" wi="142" he="77" />的特征值和对应的特征向量,将矩阵<img file="FDA00007187170300000112.GIF" wi="141" he="82" />的特征值从大到小排列得到{λ<sup>(k)</sup>}和对应的特征向量{u<sup>(k)</sup>},其中k=1,2,...q,取{u<sup>(k)</sup>}中前m个特征值对应的特征向量组合成降维矩阵Φ<sub>m</sub>,将所述高维非对称数据通过降维矩阵Φ<sub>m</sub>进行投影得到降维后的分类信息。
地址 610000 四川省成都市高新区(西区)西源大道2006号