发明名称 通用的图像中的文本定位
摘要 在一些实施例中,本发明包括一种在数字图像中定位文本的方法。该方法包括:将一个数字图像按比例变换为多种分辨率的若干个图像,和按照像素是否是一个文本区域的一部分来对所述多种分辨率下的像素进行分类。该方法还包括:将各比例进行整合以生成一个比例整合突出图形,和使用该突出图形来生成初始文本界定方框,这是通过将方框从包括至少一个像素的像素矩形扩展成包括由至少一个与所述矩形邻接的像素构成的组来完成的,其中这些组与第一阈值之间具有特定关系。将初始文本界定方框合并。在其他实施例中,一种方法包括:按照像素是否是文本区的一部分来对像素进行分类,生成初始文本界定方框,和合并初始文本界定方框,其中所述合并包括生成具有自适应阈值的水平投影轮廓和具有自适应阈值的垂直投影轮廓。
申请公布号 CN1418354A 申请公布日期 2003.05.14
申请号 CN01806580.5 申请日期 2001.02.23
申请人 英特尔公司 发明人 赖纳·W·林哈特;阿克塞尔·韦尼克
分类号 G06T5/00 主分类号 G06T5/00
代理机构 上海智信专利代理有限公司 代理人 李柏
主权项 1.一种在数字图像中定位文本的方法,包括:将一个数字图像按比例变换为多种分辨率的若干个图像;按照像素是否是一个文本区域的一部分来对所述多种分辨率下的像素进行分类;将各比例进行整合以生成一个比例整合突出图形;使用该突出图形来生成初始文本界定方框,这是通过将方框从包括至少一个像素的像素矩形扩展成包括由至少一个与所述矩形邻接的像素构成的组来完成的,其中这些组与第一阈值之间具有特定关系;和合并初始文本界定方框。
地址 美国加利福尼亚州