发明名称 文字识别装置、文字识别方法及文字识别程序
摘要 本发明提供一种可提高混合有活字和手写文字之文件中的手写文字的识别率之文字识别装置、文字识别方法及文字识别程序。利用图像输入部11生成混合有活字和手写文字之文件的输入图像,并将其由双值化部12进行双值化。对双值化图像,利用文件构造解析部14,根据段落和行划分为多数个文章区域而区块化,并对各文章区域分别利用文字分离部15进行1个文字单位的文字分离。而且,利用文件构造解析及文字分离的结果,对每一文章区域利用特征量计算部16计算特征量。特征量统计部统计特征量,并求用于分离活字和手写文字的分离系数。活字手写文字分离部18根据分离系数,对输入图像或文件构造解析部14的输出图像进行活字和手写文字的分离,并分别得到抽出图像。
申请公布号 CN1752991A 申请公布日期 2006.03.29
申请号 CN200510053566.1 申请日期 2005.03.08
申请人 富士施乐株式会社 发明人 小山俊哉;斋藤照花;馆野昌一;田中圭;榊原正义;中村浩太郎
分类号 G06K9/20(2006.01);G06K9/34(2006.01);G06K9/00(2006.01) 主分类号 G06K9/20(2006.01)
代理机构 北京三友知识产权代理有限公司 代理人 李辉
主权项 1.一种文字识别装置,其特征在于所述文字识别装置包括:对混合有活字和手写文字的文件的输入图像进行解析,并将前述输入图像划分为一定的文章区之文件构造解析部;对利用前述文件构造解析部所划分的各文章区域进行1个文字单位的文字切割之文字切割部;在每一前述文章区域对所切割出的文字计算特征量之特征量计算部;将所计算出的前述特征量在前述输入图像的一定范围内进行统计之特征量统计部;以及根据利用前述特征量统计部的统计结果,将关于前述输入图像的文字分离为前述活字和前述手写文字之活字手写文字分离部。
地址 日本东京