基于保内积降维技术的模式识别方法,申请号CN201310276362.9-传众专利搜索

发明名称	基于保内积降维技术的模式识别方法
摘要	本发明公布了一种基于保内积降维技术的模式识别方法，所述模式识别方法采用如下步骤进行降维：首先在坐标逼近的思想下建立保持局部内积的误差函数模型；然后利用矩阵向量形式的转换求解出局部的最优保内积低维坐标；在使用特征值分解求得初值后，对目标函数进行多变量迭代求解；分别使用二次函数极值求解，正交强迫分解，最小二乘等方法逐步求解迭代问题，并得到最终低维坐标。本发明对降维问题提出了新的方法，可以应用与流形学并能取得较好的效果，并在真实数据集上的分类效果能达到与现有流形方法相媲美的效果。
申请公布号	CN103310216A	申请公布日期	2013.09.18
申请号	CN201310276362.9	申请日期	2013.07.03
申请人	北京大学	发明人	林通;戚峰;查红彬
分类号	G06K9/46(2006.01)I	主分类号	G06K9/46(2006.01)I
代理机构	北京万象新悦知识产权代理事务所(普通合伙) 11360	代理人	朱红涛
主权项	1.一种基于保内积降维技术的模式识别方法，其特征是，所述模式识别方法采用如下步骤进行降维：步骤1：将样本图片按像素方式存入电脑中，即可用一个向量来表示一张图片，将所有向量的整体记作初始高维坐标矩阵X，根据高维数据点的距离关系矩阵进行近邻选择，得到各点的近邻选择矩阵S<sub>i</sub>；步骤2：建立误差函数模型：<maths num="0001"><![CDATA[<math><mrow><mi>min</mi><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msubsup><mrow><mo>\|</mo><mo>\|</mo><msub><mi>s</mi><mi>i</mi></msub><msub><mi>L</mi><mi>i</mi></msub><mo>-</mo><msub><mi>U</mi><mi>i</mi></msub><mi>Y</mi><msub><mi>S</mi><mi>i</mi></msub><mi>P</mi><mo>\|</mo><mo>\|</mo></mrow><mi>F</mi><mn>2</mn></msubsup><mo>,</mo></mrow></math>]]></maths>(公式I)其中s<sub>i</sub>为尺度因子，L<sub>i</sub>为每点近邻域内保持内积的局部低维坐标，U<sub>i</sub>表示全等变换的正交矩阵，Y为所求目标低维坐标，P为代表平移的变换矩阵；步骤3：在局部保内积模型公式II中，将约束由矩阵形式转化为向量形式，之后使用最小二乘法，求得每点近邻域的最优保内积低维坐标<img file="FDA00003455550200012.GIF" wi="71" he="66" /><maths num="0002"><![CDATA[<math><mrow><msubsup><mi>L</mi><mi>i</mi><mo></mo></msubsup><mo>=</mo><munder><mi>min</mi><mi>L</mi></munder><munder><mi>Σ</mi><mrow><mi>t</mi><mo>,</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>&Element;</mo><msub><mi>Ω</mi><mi>i</mi></msub></mrow></munder><msubsup><mrow><mo>\|</mo><mo>\|</mo><mo><</mo><msub><mi>l</mi><mi>j</mi></msub><mo>-</mo><msub><mi>l</mi><mi>t</mi></msub><mo>,</mo><msub><mi>l</mi><mi>k</mi></msub><mo>-</mo><msub><mi>l</mi><mi>t</mi></msub><mo>></mo><mo>-</mo><mo><</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>x</mi><mi>t</mi></msub><mo>,</mo><msub><mi>x</mi><mi>k</mi></msub><mo>-</mo><msub><mi>x</mi><mi>t</mi></msub><mo>></mo><mo>\|</mo><mo>\|</mo></mrow><mi>F</mi><mn>2</mn></msubsup></mrow></math>]]></maths>(公式II)其中，l代表低维信息，x代表高维信息，x的下标表示数据点在数据集中的序号，Ω<sub>i</sub>表示数据集中第i个点的近邻点的下标组成的集合，L即诸数据点坐标l组成的整体坐标矩阵，L表示此优化式的最优解；步骤4：对目误差函数模型公式I中的三个位置标量尺度因子s<sub>i</sub>、正交矩阵U<sub>i</sub>和低维坐标Y进行交替迭代求解，首先使用特征值分解求得Y的初始值，并根据原高维数据与步骤3中求得的低维坐标L<sub>i</sub>的相互关系计算出s<sub>i</sub>的初始值；步骤5：将目标函数公式I分解，分别求解三个未知变量s<sub>i</sub>，U<sub>i</sub>，Y，得到所求的低维坐标。
地址	100871 北京市海淀区颐和园路5号