发明名称 一种用于高维数据聚类的半监督降维方法
摘要 本发明公开了一种用于高维数据聚类的半监督降维方法,包括:(1)构建样本特征矩阵;(2)构建约束矩阵;(3)构建迭代方程组,迭代输出过渡矩阵;(4)求得降维后的样本特征矩阵。本发明通过在样本特征矩阵分解的过程中加入部分已知类别信息作为约束,并应用了概念分解的理念,使分解得到的系数矩阵作为高维样本特征矩阵的低维表示,将该低维矩阵用于聚类分析,可使得聚类分析变得简单而有效;同时本发明降维后的数据具有良好的可解释性,且相对于现有技术的降维方法,能够使得聚类分析的判别能力得到进一步的提高。
申请公布号 CN102411610A 申请公布日期 2012.04.11
申请号 CN201110308490.8 申请日期 2011.10.12
申请人 浙江大学 发明人 刘海风;杨政;吴朝晖
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州天勤知识产权代理有限公司 33224 代理人 胡红娟
主权项 1.一种用于高维数据聚类的半监督降维方法,包括如下步骤:(1)获取样本集合以及样本集合中p个样本的类别信息;构建样本集合的样本特征矩阵;(2)根据p个样本的类别信息,构建约束矩阵:<maths num="0001"><![CDATA[<math><mrow><mi>A</mi><mo>=</mo><mfenced open='(' close=')'><mtable><mtr><mtd><mi>C</mi></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>I</mi></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>其中:C为p个样本的类别响应矩阵,I为单位矩阵;(3)根据所述的约束矩阵和样本特征矩阵,构建以下迭代方程组并进行迭代,当迭代收敛或达到最大迭代次数,输出对应的第二过渡矩阵;<maths num="0002"><![CDATA[<math><mrow><msubsup><mi>w</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mi>t</mi></msubsup><mo>=</mo><msubsup><mi>w</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mfrac><msub><mrow><mo>(</mo><msup><mi>KAZ</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub><msub><mrow><mo>[</mo><msup><mi>KW</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><msup><mrow><mo>(</mo><msup><mi>Z</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mi>T</mi></msup><msup><mi>A</mi><mi>T</mi></msup><msup><mi>AZ</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>]</mo></mrow><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub></mfrac></mrow></math>]]></maths><maths num="0003"><![CDATA[<math><mrow><msubsup><mi>z</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mi>t</mi></msubsup><mo>=</mo><msubsup><mi>z</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mfrac><msub><mrow><mo>(</mo><msup><mi>A</mi><mi>T</mi></msup><msup><mi>KW</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub><msub><mrow><mo>[</mo><msup><mi>A</mi><mi>T</mi></msup><msup><mi>AZ</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><msup><mrow><mo>(</mo><msup><mi>W</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mi>T</mi></msup><msup><mi>KW</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>]</mo></mrow><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub></mfrac></mrow></math>]]></maths>其中:W<sup>t</sup>为t次迭代后的第一过渡矩阵,Z<sup>t</sup>为t次迭代后的第二过渡矩阵;<img file="FDA0000098139890000014.GIF" wi="111" he="75" />为t次迭代后第一过渡矩阵中第i行第j列的元素值,<img file="FDA0000098139890000015.GIF" wi="93" he="76" />为t次迭代后第二过渡矩阵中第i行第j列的元素值;K=X<sup>T</sup>X,X为样本特征矩阵;A为约束矩阵;(4)根据所述的约束矩阵和第二过渡矩阵,计算出降维后的样本特征矩阵。
地址 310027 浙江省杭州市西湖区浙大路38号