发明名称 |
基于有效阿拉伯文特征提取的阿拉伯文识别方法及系统 |
摘要 |
本发明自动识别阿拉伯文本的方法包括将一行阿拉伯字符数字化形成一关于像素的二维数组,每一像素赋予一像素值,其中像素值采用二进制数表示;将该行阿拉伯字符分为多个条图像;在多条图像的一条图像中定义多个单元,每一单元中包含一组相邻的像素;将多个条图像的一条图像内多个单元的每一单元中的像素值连续排列形成一二进制单元编号;根据得自多个条图像中一条图像的多个单元的二进制单元编号构造文本特征向量;将该文本特征向量提供给一隐马尔可夫模型以识别该行阿拉伯字符。 |
申请公布号 |
CN102142088B |
申请公布日期 |
2013.01.23 |
申请号 |
CN201010258343.X |
申请日期 |
2010.08.17 |
申请人 |
穆罕默德S·卡尔希德;侯塞因K·艾尔奥玛依;哈利德M·艾尔法依夫 |
发明人 |
穆罕默德S·卡尔希德;侯塞因K·艾尔奥玛依;哈利德M·艾尔法依夫 |
分类号 |
G06K9/62(2006.01)I;G06T7/00(2006.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
北京君尚知识产权代理事务所(普通合伙) 11200 |
代理人 |
余长江 |
主权项 |
一种自动识别阿拉伯文本的方法,其步骤包括:获取包含一行阿拉伯字符的文本图像;将该行阿拉伯字符数字化形成一关于像素的二维数组,每一像素赋予一像素值,其中像素值采用二进制数表示;将该行阿拉伯字符分为多个条图像;定义多条图像中一条图像中的多个单元,其中每一单元中包含一组相邻的像素;将多个条图像中一条图像内多个单元的每一单元中的像素值顺序排列形成一二进制单元编号;根据得自多个条图像中一条图像的多个单元的二进制单元编号构造一文本特征向量;将该文本特征向量提供给一隐马尔可夫模型以识别该行阿拉伯字符。 |
地址 |
沙特阿拉伯利雅得 |