发明名称 手写体数字识别方法及系统
摘要 本发明实施例公开了一种手写体数字识别方法及系统,在对手写体数字进行降维的过程中,对于每一个图像数据都通过K个近邻来线性表示,而对每一个图像数据通过K个近邻线性表示时的加权系数则正交匹配算法获取,而且,通过构造加权系数矩阵来对训练图像数据进行降维,而对待识别图像则通过加权系数向量及其K个近邻的降维后的向量数据进行降维,通过实验可知,本申请实施例提供的手写体数字识别方法,提高了手写体数字识别的识别率。
申请公布号 CN103310237B 申请公布日期 2016.08.24
申请号 CN201310286449.4 申请日期 2013.07.09
申请人 苏州大学 发明人 张莉;冷亦琴;包兴;杨季文;李凡长
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王宝筠
主权项 一种手写体数字识别方法,其特征在于,包括:获取图像数据集合,所述图像数据集合包括训练图像数据子集和待识别图像数据子集;将所述图像数据集合中的各个图像数据进行拉伸,获取向量数据集合,所述向量数据集合包括与所述训练图像数据子集对应的第一向量数据子集,以及与所述待识别图像数据子集对应的第二向量数据子集;依据向量数据集合中第i个向量数据与所述第一向量数据子集中的每一个向量数据之间的距离,获取所述第i个向量数据的K个近邻向量数据;用所述K个近邻向量数据线性表示所述第i个向量数据:<maths num="0001"><math><![CDATA[<mrow><msub><mi>X</mi><mi>i</mi></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msubsup><mi>w</mi><mi>i</mi><mi>j</mi></msubsup><msubsup><mi>X</mi><mi>i</mi><mi>j</mi></msubsup><mo>,</mo></mrow>]]></math><img file="FDA0000929371720000011.GIF" wi="318" he="134" /></maths>其中,X<sub>i</sub>为所述第i个向量数据;<img file="FDA0000929371720000012.GIF" wi="68" he="62" />为所述K个近邻向量数据中的第j个向量数据;<img file="FDA0000929371720000013.GIF" wi="53" he="63" />为与所述K个近邻向量数据中的第j个向量数据<img file="FDA0000929371720000014.GIF" wi="66" he="62" />对应的加权系数,<img file="FDA0000929371720000015.GIF" wi="60" he="61" />通过正交匹配追踪算法获取;当所述第i个向量数据属于所述第一向量数据子集时,获取与所述第i个向量数据对应的第一加权系数向量<img file="FDA0000929371720000016.GIF" wi="107" he="63" /><img file="FDA0000929371720000017.GIF" wi="78" he="62" />的第m个元素<img file="FDA0000929371720000018.GIF" wi="78" he="63" />对应所述第一向量数据子集中的第m个向量数据,其中,当所述第一向量数据子集中的第m个向量数据为所述第i个向量数据的K个近邻向量数据中的第j个向量数据时,<img file="FDA0000929371720000019.GIF" wi="206" he="62" />当所述第m个向量数据不属于所述第i个向量数据的K个近邻向量数据时,<img file="FDA00009293717200000110.GIF" wi="182" he="62" />依据所述第一加权系数向量对所述第一向量数据子集降维,包括:获取加权系数矩阵<img file="FDA00009293717200000111.GIF" wi="507" he="84" />其中,<img file="FDA00009293717200000112.GIF" wi="77" he="62" />(m=1,2,...,M)为与所述第一向量子集中的第m个向量数据对应的加权系数向量;构造矩阵<img file="FDA00009293717200000113.GIF" wi="646" he="95" />其中I是单位矩阵;对矩阵M<sub>train</sub>进行特征分解,获取特征值,其中,第q个特征值为λ<sub>q</sub>,第q个特征值对应的特征向量为v<sub>q</sub>,v<sub>q</sub>为M×1维的列向量;将特征值按照取值的大小进行排序,按照从小到大的顺序获取第2个至第d+1个特征值所对应的特征向量,并将获取的特征向量组成向量数据矩阵Y<sub>train</sub>=[v<sub>2</sub>,v<sub>3</sub>,…,v<sub>d+1</sub>],其中,d为预设的降维后的维数,所述第一向量数据子集中的第m个向量数据X<sub>m</sub>对应的降维后的向量数据为x<sub>m</sub>所述向量数据矩阵Y<sub>train</sub>的第m行向量;当所述第i个向量数据属于所述第二向量数据子集时,获取与所述第i个向量数据对应的第二加权系数向量<img file="FDA0000929371720000021.GIF" wi="105" he="69" /><img file="FDA0000929371720000022.GIF" wi="77" he="61" />的第j个元素<img file="FDA0000929371720000023.GIF" wi="80" he="73" />对应所述第i个向量数据的K个近邻向量数据中的第j个向量数据,<img file="FDA0000929371720000024.GIF" wi="205" he="63" />依据所述第二加权系数向量对所述第二向量数据子集降维,包括:依据与所述第二向量数据子集中的第n个向量数据相对应的第二加权系数向量<img file="FDA0000929371720000025.GIF" wi="75" he="63" />以及与所述第二向量数据子集中的第n个向量数据的K个近邻向量数据对应的降维后的向量数据集<img file="FDA0000929371720000026.GIF" wi="451" he="85" />获取所述第二向量数据子集中第n个向量数据X<sub>n</sub>对应的降维后的向量数据x<sub>n</sub>,具体为:<maths num="0002"><math><![CDATA[<mrow><msub><mi>x</mi><mi>n</mi></msub><mo>=</mo><msubsup><mi>Y</mi><mrow><mi>t</mi><mi>e</mi><mi>s</mi><mi>t</mi></mrow><mi>n</mi></msubsup><mo>&CenterDot;</mo><msubsup><mi>W</mi><mi>n</mi><mrow><mi>t</mi><mi>e</mi><mi>T</mi></mrow></msubsup><mo>;</mo></mrow>]]></math><img file="FDA0000929371720000027.GIF" wi="333" he="78" /></maths>依据降维后的第一向量数据子集中的任意一向量数据与降维后的第二向量数据子集中第n个向量数据之间的距离,获取降维后的第二向量数据子集中第n个向量数据的K个近邻向量数据;依据所述第n个向量数据的K个近邻向量数据对应的图像数据的数字类型确定与所述降维后的第二向量数据子集中第n个向量数据对应的待识别图像数据的数字类型;其中,所述通过正交匹配追踪算法获取<img file="FDA0000929371720000028.GIF" wi="58" he="62" />包括至少一次迭代运算:在每一次迭代运算中,在所述第i个向量数据的K个近邻向量数据中选择一个未确定权值的向量数据<img file="FDA0000929371720000029.GIF" wi="105" he="70" />使得<img file="FDA00009293717200000210.GIF" wi="322" he="158" />最小,从而确定<img file="FDA00009293717200000211.GIF" wi="85" he="62" />其中,<img file="FDA00009293717200000212.GIF" wi="53" he="61" />为第j次迭代运算中与所选择的向量数据<img file="FDA00009293717200000213.GIF" wi="75" he="62" />相对应的权值;f=1,2,…,u,u为预设的迭代次数。
地址 215123 江苏省苏州市工业园区仁爱路199号