发明名称 基于保内积降维技术的模式识别方法
摘要 本发明公布了一种基于保内积降维技术的模式识别方法,所述模式识别方法采用如下步骤进行降维:首先在坐标逼近的思想下建立保持局部内积的误差函数模型;然后利用矩阵向量形式的转换求解出局部的最优保内积低维坐标;在使用特征值分解求得初值后,对目标函数进行多变量迭代求解;分别使用二次函数极值求解,正交强迫分解,最小二乘等方法逐步求解迭代问题,并得到最终低维坐标。本发明对降维问题提出了新的方法,可以应用与流形学并能取得较好的效果,并在真实数据集上的分类效果能达到与现有流形方法相媲美的效果。
申请公布号 CN103310216A 申请公布日期 2013.09.18
申请号 CN201310276362.9 申请日期 2013.07.03
申请人 北京大学 发明人 林通;戚峰;查红彬
分类号 G06K9/46(2006.01)I 主分类号 G06K9/46(2006.01)I
代理机构 北京万象新悦知识产权代理事务所(普通合伙) 11360 代理人 朱红涛
主权项 1.一种基于保内积降维技术的模式识别方法,其特征是,所述模式识别方法采用如下步骤进行降维:步骤1:将样本图片按像素方式存入电脑中,即可用一个向量来表示一张图片,将所有向量的整体记作初始高维坐标矩阵X,根据高维数据点的距离关系矩阵进行近邻选择,得到各点的近邻选择矩阵S<sub>i</sub>;步骤2:建立误差函数模型:<maths num="0001"><![CDATA[<math><mrow><mi>min</mi><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msubsup><mrow><mo>|</mo><mo>|</mo><msub><mi>s</mi><mi>i</mi></msub><msub><mi>L</mi><mi>i</mi></msub><mo>-</mo><msub><mi>U</mi><mi>i</mi></msub><mi>Y</mi><msub><mi>S</mi><mi>i</mi></msub><mi>P</mi><mo>|</mo><mo>|</mo></mrow><mi>F</mi><mn>2</mn></msubsup><mo>,</mo></mrow></math>]]></maths>(公式I)其中s<sub>i</sub>为尺度因子,L<sub>i</sub>为每点近邻域内保持内积的局部低维坐标,U<sub>i</sub>表示全等变换的正交矩阵,Y为所求目标低维坐标,P为代表平移的变换矩阵;步骤3:在局部保内积模型公式II中,将约束由矩阵形式转化为向量形式,之后使用最小二乘法,求得每点近邻域的最优保内积低维坐标<img file="FDA00003455550200012.GIF" wi="71" he="66" /><maths num="0002"><![CDATA[<math><mrow><msubsup><mi>L</mi><mi>i</mi><mo>*</mo></msubsup><mo>=</mo><munder><mi>min</mi><mi>L</mi></munder><munder><mi>&Sigma;</mi><mrow><mi>t</mi><mo>,</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>&Element;</mo><msub><mi>&Omega;</mi><mi>i</mi></msub></mrow></munder><msubsup><mrow><mo>|</mo><mo>|</mo><mo>&lt;</mo><msub><mi>l</mi><mi>j</mi></msub><mo>-</mo><msub><mi>l</mi><mi>t</mi></msub><mo>,</mo><msub><mi>l</mi><mi>k</mi></msub><mo>-</mo><msub><mi>l</mi><mi>t</mi></msub><mo>></mo><mo>-</mo><mo>&lt;</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>x</mi><mi>t</mi></msub><mo>,</mo><msub><mi>x</mi><mi>k</mi></msub><mo>-</mo><msub><mi>x</mi><mi>t</mi></msub><mo>></mo><mo>|</mo><mo>|</mo></mrow><mi>F</mi><mn>2</mn></msubsup></mrow></math>]]></maths>(公式II)其中,l代表低维信息,x代表高维信息,x的下标表示数据点在数据集中的序号,Ω<sub>i</sub>表示数据集中第i个点的近邻点的下标组成的集合,L即诸数据点坐标l组成的整体坐标矩阵,L*表示此优化式的最优解;步骤4:对目误差函数模型公式I中的三个位置标量尺度因子s<sub>i</sub>、正交矩阵U<sub>i</sub>和低维坐标Y进行交替迭代求解,首先使用特征值分解求得Y的初始值,并根据原高维数据与步骤3中求得的低维坐标L<sub>i</sub>的相互关系计算出s<sub>i</sub>的初始值;步骤5:将目标函数公式I分解,分别求解三个未知变量s<sub>i</sub>,U<sub>i</sub>,Y,得到所求的低维坐标。
地址 100871 北京市海淀区颐和园路5号