发明名称 用于对网页图片内容进行段落重排的方法及装置
摘要 本发明提供一种对根据特定网页字符切分方法切分出的单个字符进行段落重排的方法,包括:根据正在处理的网页图片中的一行文字的行首空白,确定该行文字是否是网页图片中的新段落的开始行;在确定是新段落的开始行时,将该行文字作为重排后的新段落的开始行并保留原来的行首空白,利用根据该行文字切分出的所有单个字符,根据移动终端的屏幕尺寸进行段落重排;以及在确定不是新段落的开始行时,利用根据该行文字切分出的所有单个字符,紧接已经重排的前一行文字的结尾字符,根据移动终端的屏幕尺寸进行段落重排。利用上述方法,可以根据移动终端的屏幕尺寸,对切分出的单个字符进行段落重排,以适合于在移动终端的屏幕上显示,从而增强用户体验。
申请公布号 CN101984419B 申请公布日期 2013.08.28
申请号 CN201010521693.0 申请日期 2010.10.21
申请人 优视科技有限公司 发明人 梁捷;周志明
分类号 G06F17/21(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/21(2006.01)I
代理机构 北京鸿元知识产权代理有限公司 11327 代理人 林锦辉
主权项 一种对根据网页图片内容切分出的单个字符进行段落重排的方法,包括:根据正在处理的网页图片中的一行文字的行首空白,确定该行文字是否是该网页图片中的新段落的开始行;在确定为该行文字是该网页图片中的新段落的开始行时,将该行文字作为重排后的新段落的开始行并保留原来的行首空白,利用根据该行文字切分出的所有单个字符,根据移动终端的屏幕尺寸进行段落重排;以及在确定为该行文字不是新段落的开始行时,利用根据该行文字切分出的所有单个字符,紧接已经重排的前一行文字的结尾字符,根据移动终端的屏幕尺寸进行段落重排;其中,在利用根据该行文字切分出的所有单个字符,根据移动终端的屏幕尺寸进行重排时,还包括:对于重排之后处于同一行的相邻位置的两个字符,根据该两个字符在网页图片中的位置关系,设置该两个字符重排时的间距,其中,如果该两个字符在网页图片上处于同一行且相邻,则在重排时将该两个字符的间距保持为原来的间距,如果该两个字符在网页图片上处于不同行,则在重排时将该两个字符的间距设置为预定间距;根据重排后的相邻行是否位于同一段落,将相邻行之间的间距设置为具有不同间距;以及对于网页图片上处于同一行且相邻的两个文字,如果重排之后不再处于同一行的相邻位置,则将前一文字作为行尾文字,以及将后一文字作为新行的行首文字,其中,所述单个字符是利用下述字符切分方法对网页图片进行字符切分而获得的字符:对所获取的网页图片中的像素进行逐行扫描,以行为单位将该网页图片划分为由连续空白像素行组成的第一空白区域和由连续内容像素行组成的第一内容区域;从所获取的网页图片中切分出所划分出的第一内容区域;针对每个所切分出的第一内容区域的像素进行逐列扫描,以列为单位将 该第一内容区域划分为由连续空白像素列组成的第二空白区域和由连续内容像素列组成的第二内容区域;以及根据各个第二空白区域的像素坐标,将第二内容区域与第二空白区域切分开,以将切分出的各个第二内容区域作为各个第一内容区域中的各个单个字符。
地址 100080 北京市海淀区苏州街29号院18号楼维亚大厦16层1610-1620