发明名称 一种扫描版文档重排版的方法
摘要 本发明公开了一种扫描版文档重排版的方法,将扫描版文档生成图像,进行采样获得待处理的彩色图像,转化为二值图,对二值图进行游程平滑、求取连通域,将初始块进行水平合并,得出文字的行信息和图片位置,再进行垂直合并,得出文字段落位置,根据文字段落位置和图片位置,对段落进行文字切分,确定各段文字的阅读顺序后,根据文字段落位置、图片位置和文字段落中文字的位置,将文字和图片按照预先指定的全图宽度和高度排版成新的图像。采用了本发明的技术方案,能够将扫描版文档根据电子阅读设备的显示器的尺寸进行重排版,方便用户阅读,提高用户使用电子阅读设备的感受度。
申请公布号 CN102890826A 申请公布日期 2013.01.23
申请号 CN201110302266.8 申请日期 2011.10.09
申请人 北京多看科技有限公司 发明人 安宇;王川
分类号 G06T11/60(2006.01)I 主分类号 G06T11/60(2006.01)I
代理机构 代理人
主权项 一种扫描版文档重排版的方法,其特征在于,包括以下步骤:A、将扫描版文档生成图像,对生成的图像进行采样获得待处理的彩色图像;B、将采样获得的彩色图像转化为二值图;C、对二值图进行游程平滑;D、对游程平滑处理后的二值图求取连通域,把同值的且连通的一块区域的外接矩形的位置记录下来,作为初始块位置信息;E、将初始块进行水平合并,得出文字的行信息和图片位置;F、将水平合并后的块进行垂直合并,得出文字段落位置;G、根据文字段落位置和图片位置,对段落进行文字切分,首先在段落区域位置内进行水平投影,确定每行文字的位置,然后在一行的区域位置内进行垂直投影,确定每个文字的位置;H、确定各段文字的阅读顺序;I、根据文字段落位置、图片位置和文字段落中文字的位置,将文字和图片按照预先指定的全图宽度和高度排版成新的图像。
地址 100029 北京市朝阳区安定路39号1幢1105室