发明名称 指定文本行提取方法和装置
摘要 指定文本行提取方法和装置。本发明的在垂直方向上分离文本行图像的方法,包括:多行判断步骤,判断所述文本行图像是否包含多行文本;行间噪声去除步骤,在判断出所述文本行图像包含多行文本时,进行行间噪声去除。本发明还提供了一种提取指定文本行的方法。
申请公布号 CN100514355C 申请公布日期 2009.07.15
申请号 CN200510098628.0 申请日期 2005.09.05
申请人 富士通株式会社 发明人 孙俊;堀田悦伸;藤本克仁;直井聪
分类号 G06K9/20(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 北京三友知识产权代理有限公司 代理人 李 辉
主权项 1、一种在垂直方向上分离文本行图像的方法,所述方法包括判断所述文本行图像是否包含多行文本的多行判断步骤,所述多行判断步骤判断该文本行图像高度是否大于文本行高度阈值,如果该文本行图像的高度大于所述文本行高度阈值,则判断其包含多行文本,否则判断其未包含多行文本,其特征在于,所述文本行图像为二值图像,所述方法包括:笔画阈值获得步骤,用于获得表明有效文本行中的最少字符数的第一笔画阈值;行间噪声去除步骤,在判断出所述文本行图像包含多行文本时,使用所述第一笔画阈值,利用笔画直方图法,进行行间噪声去除。
地址 日本神奈川县
您可能感兴趣的专利