发明名称 一种图文切分方法及系统
摘要 本发明涉及一种图文切分方法及系统,属于图像切分技术领域。本发明首先建立图片的绝对坐标系;然后依据识别的字符排版方向,先将图片按照该方向切为若干图片条,每个图片条包含一行或一列字符;再将每个图片条按照与该方向垂直的方向切分成若干一定长度的子图片;最后记录每个子图片的位置编码。通过本发明能够精确的实现切分图片与原始图片的字符定位以及字符关联,能够很好的适用于对切分图片内字符识别后拼接原始图片的全文。
申请公布号 CN102456136B 申请公布日期 2013.06.05
申请号 CN201010530630.1 申请日期 2010.10.29
申请人 方正国际软件(北京)有限公司;方正国际软件有限公司 发明人 吴建宇
分类号 G06K9/34(2006.01)I 主分类号 G06K9/34(2006.01)I
代理机构 北京天悦专利代理事务所(普通合伙) 11311 代理人 田明;任晓航
主权项 一种图文切分方法,包括以下步骤:(1)建立图片的绝对坐标系,所述图片是指仅包含字符内容的矩形图片;(2)依据识别的字符排版方向,先将图片按照字符排版方向切分为若干图片条,每个图片条包含一行或一列字符;然后再将每个图片条按照与字符排版方向垂直的方向切分成若干设定长度的子图片,切分图片条的过程如下:从待切分图片条的起点开始,先记录所述起点的绝对坐标,然后按照切分方向查找设定长度的预切分线;如果预切分线上黑像素个数超过阈值M,则沿着切分方向每像素步长移动预切分线,查找预切分线上黑像素个数不大于阈值的位置,将该位置作为切分位置切分图片条;否则,直接将预切分线位置作为切分位置切分图片条;下一次切分操作从上一个切分位置开始计算设定长度;所述切分方向为待切分图片条中字符的排版方向;(3)记录每个子图片的位置。
地址 100080 北京市海淀区北四环西路52号中芯大厦19层