从高维非对称数据中提取分类信息的方法,申请号CN201510251168.4-传众专利搜索

发明名称	从高维非对称数据中提取分类信息的方法
摘要	本发明涉及信号与图像处理领域，提供一种从高维非对称数据中提取分类信息的方法，以解决现有相关分类信息提取方法要么不适合样本不对称的数据，要么计算复杂高、处理高维数据时容易发生计算量溢出的问题，该方法包括：获取高维非对称数据；对Σ<sub>o</sub>和Σ<sub>c</sub>赋以新的权重，组成新的协方差矩阵Σ<sub>α</sub>代替Σ<sub>t</sub>进行特征分解，求解其特征值和特征向量；组合得到降维矩阵，将高维非对称数据通过降维矩阵进行投影得到降维后的分类信息。本发明提出的技术方案计算复杂度低、准确性高、运行速度快、稳定性好。
申请公布号	CN105005783A	申请公布日期	2015.10.28
申请号	CN201510251168.4	申请日期	2015.05.18
申请人	电子科技大学	发明人	刘丁赟;饶妮妮;刘汉明;郑洁;黎桑;曾伟
分类号	G06K9/62(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构	四川省成都市天策商标专利事务所 51213	代理人	罗韬
主权项	一种从高维非对称数据中提取分类信息的方法，其特征在于包括如下步骤：步骤A：获取高维非对称数据，所述高维非对称数据由阳性样本和阴性样本组成，分析得到所述高维非对称数据的维度n、所述高维非对称数据的总样本数量q、所述阳性样本的样本数量q<sub>o</sub>、所述阴性样本的样本数量q<sub>c</sub>，设置待提取的分类信息的维数m；步骤B：计算高维非对称样本数据的均值向量M、阳性类样本的均值向量M<sub>o</sub>、阴性类样本的均值向量M<sub>c</sub>，分别中心化阳性样本和阴性样本得到中心化后的阳性样本集合矩阵S<sub>o</sub>、中心化后的阴性样本集合矩阵S<sub>c</sub>；步骤C：分别构建矩阵X<sub>o</sub>、矩阵X<sub>c</sub>、矩阵X<sub>mo</sub>、矩阵X<sub>mc</sub>，其中<img file="FDA0000718717030000011.GIF" wi="400" he="95" />α<sub>o</sub>＝q<sub>c</sub>/q、<maths id="cmaths0001" num="0001"><math><![CDATA[<mrow><msub><mi>X</mi><mi>c</mi></msub><mo>=</mo><msqrt><msub><mi>α</mi><mi>c</mi></msub><mo>/</mo><msub><mi>q</mi><mi>c</mi></msub></msqrt><msub><mi>S</mi><mi>c</mi></msub><mo>,</mo></mrow>]]></math><img file="FDA0000718717030000012.GIF" wi="390" he="98" /></maths>α<sub>c</sub>＝q<sub>o</sub>/q、<maths id="cmaths0002" num="0002"><math><![CDATA[<mrow><msub><mi>X</mi><mi>mo</mi></msub><mo>=</mo><msqrt><msub><mi>α</mi><mi>c</mi></msub></msqrt><mrow><mo>(</mo><msub><mi>M</mi><mi>o</mi></msub><mo>-</mo><mi>M</mi><mo>)</mo></mrow><mo>,</mo><msub><mi>X</mi><mi>mc</mi></msub><mo>=</mo><msqrt><msub><mi>α</mi><mi>o</mi></msub></msqrt><msqrt><msub><mi>M</mi><mi>c</mi></msub><mo>-</mo><mi>M</mi></msqrt><mo>;</mo></mrow>]]></math><img file="FDA0000718717030000013.GIF" wi="1019" he="96" /></maths>步骤D：计算矩阵X<sub>o</sub><sup>T</sup>X<sub>o</sub>的非零特征值<img file="FDA0000718717030000014.GIF" wi="138" he="104" />和对应的特征向量<img file="FDA0000718717030000015.GIF" wi="166" he="104" />矩阵X<sub>c</sub><sup>T</sup>X<sub>c</sub>的非零特征值<img file="FDA0000718717030000016.GIF" wi="148" he="104" />和对应的特征向量<img file="FDA0000718717030000017.GIF" wi="173" he="104" />X<sub>mo</sub><sup>T</sup>X<sub>mo</sub>的特征值λ<sub>mo</sub>和对应的特征向量u<sub>mo</sub>、矩阵X<sub>mc</sub><sup>T</sup>X<sub>mc</sub>的特征值λ<sub>mc</sub>和对应的特征向量u<sub>mc</sub>；步骤E：根据步骤D中得到的特征向量拼凑出对角化矩阵U和对角阵Λ，并构建矩阵<img file="FDA0000718717030000018.GIF" wi="125" he="79" />其中<maths id="cmaths0003" num="0003"><math><![CDATA[<mrow><mi>U</mi><mo>=</mo><mo>[</mo><msubsup><mi>u</mi><mi>o</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>u</mi><mi>o</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>u</mi><mi>o</mi><mrow><mo>(</mo><msub><mi>q</mi><mi>o</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>u</mi><mi>c</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>u</mi><mi>c</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>u</mi><mi>c</mi><mrow><mo>(</mo><msub><mi>q</mi><mi>c</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msub><mi>u</mi><mi>mo</mi></msub><mo>,</mo><msub><mi>u</mi><mi>mo</mi></msub><mo>]</mo><mo>,</mo></mrow>]]></math><img file="FDA0000718717030000019.GIF" wi="1190" he="89" /></maths><maths id="cmaths0004" num="0004"><math><![CDATA[<mrow><mi>Λ</mi><mo>=</mo><mi>diag</mi><mrow><mo>(</mo><msubsup><mi>λ</mi><mi>o</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>λ</mi><mi>o</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>λ</mi><mi>o</mi><mrow><mo>(</mo><msub><mi>q</mi><mi>o</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>λ</mi><mi>c</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>λ</mi><mi>c</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>λ</mi><mi>c</mi><mrow><mo>(</mo><msub><mi>q</mi><mi>c</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msub><mi>λ</mi><mi>mo</mi></msub><mo>,</mo><msub><mi>λ</mi><mi>mc</mi></msub><mo>)</mo></mrow><mo>,</mo><mover><mi>X</mi><mo>^</mo></mover><mo>=</mo><msqrt><mi>Λ</mi></msqrt><msup><mi>U</mi><mi>T</mi></msup><mo>;</mo></mrow>]]></math><img file="FDA00007187170300000110.GIF" wi="1617" he="103" /></maths>步骤F：计算矩阵<img file="FDA00007187170300000111.GIF" wi="142" he="77" />的特征值和对应的特征向量，将矩阵<img file="FDA00007187170300000112.GIF" wi="141" he="82" />的特征值从大到小排列得到{λ<sup>(k)</sup>}和对应的特征向量{u<sup>(k)</sup>}，其中k＝1,2,...q，取{u<sup>(k)</sup>}中前m个特征值对应的特征向量组合成降维矩阵Φ<sub>m</sub>，将所述高维非对称数据通过降维矩阵Φ<sub>m</sub>进行投影得到降维后的分类信息。
地址	610000 四川省成都市高新区（西区）西源大道2006号