发明名称 |
一种基于拆分匹配的汉字笔画自动提取方法 |
摘要 |
本发明公开了一种基于拆分匹配的汉字笔画自动提取方法,属于模式识别与信息处理技术领域,其步骤如下:一、根据汉字结构,将汉字拆分为多个笔画部件;二、提取出笔画部件的骨骼图,找到骨骼图中的交叉点,再计算二值图像中该交叉点的二维邻域中点PBOD曲线,将交叉点区域提取出来;三、对笔画部件提取特征,该特征与标准库中的笔画部件的特征进行进行匹配;四、根据匹配结果对笔画段进行组合,获得汉字的笔画。本发明对于不同字体的汉字都能达到让人满意的提取效果,有效地改善汉字笔画提取准确度不理想,提取速度慢的不足,而且在标准字库愈来愈全面后,笔画提取准确度也越来越高。 |
申请公布号 |
CN104182748A |
申请公布日期 |
2014.12.03 |
申请号 |
CN201410404614.6 |
申请日期 |
2014.08.15 |
申请人 |
电子科技大学 |
发明人 |
董乐;梁燕;封宁;徐宗懿;张宁 |
分类号 |
G06K9/34(2006.01)I;G06K9/46(2006.01)I |
主分类号 |
G06K9/34(2006.01)I |
代理机构 |
成都华典专利事务所(普通合伙) 51223 |
代理人 |
徐丰 |
主权项 |
一种基于拆分匹配的汉字笔画自动提取方法,包括如下步骤:步骤一:根据汉字结构,将汉字拆分为多个笔画部件;步骤二:通过细化算法提取出步骤一得到的笔画部件的骨骼图,并通过计算每个字符像素的相交数找到骨骼图中的交叉点,再计算二值图像中该交叉点二维邻域中点PBOD曲线,将交叉点区域提取出来,其它的则为笔画段;步骤三:对步骤一得到的笔画部件提取特征,提取到的特征与标准库中的笔画部件的特征进行匹配;步骤四:根据步骤三的匹配结果对笔画段进行组合,获得汉字的笔画;如果笔画部件匹配成功,则对步骤二所获得的交叉点和笔画段进行优化后,按照标准库中相匹配的笔画部件的笔画段组合方式直接进行组合并输出;如果匹配失败则根据笔画段组合规则对其进行笔画提取,并通过交互,将正确提取笔画的笔画部件及其交叉点和组合方式添加到标准库。 |
地址 |
610041 四川省成都市高新西区西源大道2006号 |