发明名称 一种文本图像的切边方法
摘要 本发明揭示了一种文本图像的切边方法,所述方法包括如下步骤:步骤110,获取文本图像数据;步骤120,通过直线检测的方法检测出文本图像的直线,得到切边四边形的边缘;步骤130,对图像数据进行文本检测,得到文本区域的边界点的坐标;步骤140,根据步骤120和步骤130的结果得到最后的切边结果。本发明可自动检测文本区域的边缘,并通过文字检测的方法,利用检测到的文字区域对文本边缘进行验证和纠正,大幅度提高了检测到文本区域的准确性,从而去掉了不相关的冗余信息,使用户浏览图像数据时看到的图像是有只含有文本区域的对用户有价值的部分。
申请公布号 CN102201053A 申请公布日期 2011.09.28
申请号 CN201010583973.4 申请日期 2010.12.10
申请人 上海合合信息科技发展有限公司 发明人 龙腾;张彬;罗希平
分类号 G06K9/00(2006.01)I;G06T7/00(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 上海光华专利事务所 31219 代理人 王松
主权项 一种文本图像的切边方法,其特征在于,所述方法包括如下步骤:步骤110,获取文本图像数据;获取图像数据的方法包括以下三种之一:方法之一是用数码相机拍摄得到的图像;方法之二是用扫描仪得到的图像数据;方法之三是打开一个预先存在的包含有图像数据的文件,读取该文件中的数据并按照标准算法解压缩后得到的图像数据;步骤120,通过直线检测的方法检测出文本图像的直线,得到切边四边形的边缘;通过检测到的直线得到多个候选的四边形区域;步骤130,对图像数据进行文本检测,得到文本区域的边界点的坐标;步骤140,根据步骤120和130的结果得到最后的切边结果;步骤140的具体步骤如下:‑步骤210,将步骤120得到的所有切边四边形组成一个候选四边形集合;‑步骤220,如果候选四边形集合为空,转入步骤260,否则进入步骤230;‑步骤230,从四边形候选集合移取下一个候选四边形;‑步骤240,判断文本区域的所有边界点是否在候选四边形中,如果是则该文本区域为有效的切边四边形转步骤250,如果否,转步骤220;‑步骤250,返回有效的切边四边形;‑步骤260,将整张图像返回给用户供其手工确定切边四边形;步骤150,结束。
地址 200433 上海市杨浦区复旦高新科技园国定路335号一号楼11011A室