发明名称 一种基于ELM与图正则化的数据表示方法
摘要 本发明公开了一种基于ELM与图正则化的数据表示方法,包括计算原始数据集的最近邻图,用ELM特征投影将D维原始数据集转换成L维原始数据集,生成初始化非负矩阵,对于每个i,j进行迭代更新,直到收敛即err<ε,或者,或达到最大迭代次数Max。本发明中的GNMF通过植入一个几何正则化矩阵,可以发掘数据空间中的固有几何性质和识别数据空间中的结构,它比原始NMF方法更强大,同时将ELM特征映射和GNMF相结合的方法能在获得效率的同时,保持泛化性能,在处理高维数据时,EFM GNMF的效率比直接使用NMF或GNMF更高。与EFM NMF效率没有保持泛化性能不同,EFM GNMF可以达到类似GNMF的结果。
申请公布号 CN103838974A 申请公布日期 2014.06.04
申请号 CN201410099958.0 申请日期 2014.03.18
申请人 湖州师范学院 发明人 蒋云良;刘勇;曾智勇;张雄涛
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 北京天奇智新知识产权代理有限公司 11340 代理人 韩洪
主权项 1.一种基于ELM与图正则化的数据表示方法,其特征在于:依次包括以下步骤:a)计算原始数据集的最近邻图,即权重矩阵W;b)用ELM特征投影h(x)=[h<sub>1</sub>(x),…,h<sub>i</sub>(x),…,h<sub>L</sub>(x)]<sup>T</sup>将原始数据集投影到ELM特征空间,将D维原始数据集转换成L维原始数据集,<img file="FDA0000478337220000011.GIF" wi="1190" he="93" />X表示D维原始数据集,H表示L维原始数据集,M表示数据集中样本的个数;c)生成初始化非负矩阵<img file="FDA0000478337220000012.GIF" wi="192" he="75" />和<img file="FDA0000478337220000013.GIF" wi="235" he="93" />d)用G作为ELM特征空间数据的最近邻图权重矩阵,P是一个对角矩阵,P的元素是G行向量的和,即P<sub>jj</sub>=Σ<sub>l</sub>G<sub>jl</sub>;e)对于每个i,j进行迭代更新,直到收敛即err<ε,或达到最大迭代次数Max:e1)<maths num="0001"><![CDATA[<math><mrow><msubsup><mi>U</mi><mi>ij</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mo>&LeftArrow;</mo><msubsup><mi>U</mi><mi>ij</mi><mi>t</mi></msubsup><mfrac><msub><mrow><mo>(</mo><msup><mi>HV</mi><mi>T</mi></msup><mo>)</mo></mrow><mi>ij</mi></msub><msub><mrow><mo>(</mo><msup><mi>U</mi><mi>t</mi></msup><msup><mi>VV</mi><mi>T</mi></msup><mo>)</mo></mrow><mi>ij</mi></msub></mfrac><mo>;</mo></mrow></math>]]></maths>e2)<maths num="0002"><![CDATA[<math><mrow><msubsup><mi>V</mi><mi>ij</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mtext>&LeftArrow;</mtext><msubsup><mi>V</mi><mi>ij</mi><mi>t</mi></msubsup><mfrac><msub><mrow><mo>(</mo><msup><mi>H</mi><mi>T</mi></msup><mi>U</mi><mo>+</mo><msup><mi>&lambda;GV</mi><mi>T</mi></msup><mo>)</mo></mrow><mi>ij</mi></msub><msub><mrow><mo>(</mo><msup><mrow><mo>(</mo><msup><mi>U</mi><mi>T</mi></msup><msup><mi>UV</mi><mi>t</mi></msup><mo>)</mo></mrow><mi>T</mi></msup><mo>+</mo><msup><mi>&lambda;PV</mi><mi>T</mi></msup><mo>)</mo></mrow><mi>ij</mi></msub></mfrac><mo>;</mo></mrow></math>]]></maths>e3)<maths num="0003"><![CDATA[<math><mrow><mi>err</mi><mo>&LeftArrow;</mo><mi>max</mi><mo>{</mo><mfrac><mrow><mo>|</mo><mo>|</mo><msup><mi>U</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msup><mo>-</mo><msup><mi>U</mi><mi>t</mi></msup><mo>|</mo><mo>|</mo></mrow><msqrt><mi>LK</mi></msqrt></mfrac><mo>,</mo><mfrac><mrow><mo>|</mo><mo>|</mo><msup><mi>v</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msup><mo>-</mo><msup><mi>v</mi><mi>t</mi></msup><mo>|</mo><mo>|</mo></mrow><msqrt><mi>KM</mi></msqrt></mfrac><mo>}</mo><mo>;</mo></mrow></math>]]></maths>所述λ表示正则化参数,λ≥0,K表示数据集矩阵分解后的维数,ε表示阀值,ε>0。
地址 313100 浙江省湖州市吴兴区学士路1号