发明名称 |
一种基于稀疏编码的字体识别方法 |
摘要 |
本发明提供了一种基于稀疏编码的字体识别方法。本发明以灰度图像作为输入,对于任意一幅待测试图像进行以下两个阶段的操作:在训练阶段,将各类字体的待测试图像随机划分成一定数量的方块,方块的数量由图像大小以及方块大小共同决定,例如一幅512×512的灰度图像,可以划分成4096个8×8大小的方块。对于任一类字体,以划分出的方块为输入,利用独立成分分析方法训练出一组能够稀疏表示任一方块的基函数,并将这些基函数作为该类字体的模型。本发明可以对中文字体进行识别;也可以对其它语言的字体进行识别;还可以对不同语言的字体进行识别。本发明可以应用在自动文档分析和艺术设计等方面。 |
申请公布号 |
CN102262731A |
申请公布日期 |
2011.11.30 |
申请号 |
CN201110192198.4 |
申请日期 |
2011.07.11 |
申请人 |
哈尔滨工业大学 |
发明人 |
姚鸿勋;张盛平;孙鑫;卢修生 |
分类号 |
G06K9/20(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06K9/20(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于稀疏编码的字体识别方法,其特征在于,以灰度图像作为待测试图像并进行以下两个阶段的操作,在训练阶段,将各类别字体的待测试图像划分成方块,并将各方块的基函数作为该类字体的模型,所述各方块的基函数通过独立成份分析模型训练,并能够稀疏线性表示各方块;在测试阶段,将待测试图像划分成方块,并计算各方块在各类字体的基函数模型下线性表示的系数,通过计算系数分布的峰度来判断系数的稀疏性,从而将待测试图像包含的字体识别为产生最稀疏表示的那一类字体。 |
地址 |
150001 黑龙江省哈尔滨市南岗区西大直街92号 |