发明名称 一种基于稀疏编码的字体识别方法
摘要 本发明提供了一种基于稀疏编码的字体识别方法。本发明以灰度图像作为输入,对于任意一幅待测试图像进行以下两个阶段的操作:在训练阶段,将各类字体的待测试图像随机划分成一定数量的方块,方块的数量由图像大小以及方块大小共同决定,例如一幅512×512的灰度图像,可以划分成4096个8×8大小的方块。对于任一类字体,以划分出的方块为输入,利用独立成分分析方法训练出一组能够稀疏表示任一方块的基函数,并将这些基函数作为该类字体的模型。本发明可以对中文字体进行识别;也可以对其它语言的字体进行识别;还可以对不同语言的字体进行识别。本发明可以应用在自动文档分析和艺术设计等方面。
申请公布号 CN102262731A 申请公布日期 2011.11.30
申请号 CN201110192198.4 申请日期 2011.07.11
申请人 哈尔滨工业大学 发明人 姚鸿勋;张盛平;孙鑫;卢修生
分类号 G06K9/20(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 代理人
主权项 一种基于稀疏编码的字体识别方法,其特征在于,以灰度图像作为待测试图像并进行以下两个阶段的操作,在训练阶段,将各类别字体的待测试图像划分成方块,并将各方块的基函数作为该类字体的模型,所述各方块的基函数通过独立成份分析模型训练,并能够稀疏线性表示各方块;在测试阶段,将待测试图像划分成方块,并计算各方块在各类字体的基函数模型下线性表示的系数,通过计算系数分布的峰度来判断系数的稀疏性,从而将待测试图像包含的字体识别为产生最稀疏表示的那一类字体。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号