发明名称 扫描版文件在小屏幕设备智能分版的方法及装置
摘要 本发明公开了一种扫描版文件在小屏幕设备阅读的方法及装置。通过分析扫描版文件中版面上内容的位置和排版信息,重新对版面中的信息进行切分和重组,能快速高效的对版面进行重排,使重排后的版面更适合在小屏幕上阅读。从宏观上看整个文档版面重排了,更适合小屏幕阅读,从微观上看,切出来的每一块内容都和原始版面一模一样,避免了信息的丢失。这也为小屏幕设备上阅读电子文档提供了一种新的思路。
申请公布号 CN105512647A 申请公布日期 2016.04.20
申请号 CN201610035391.X 申请日期 2016.01.19
申请人 同方知网(北京)技术有限公司;《中国学术期刊(光盘版)》电子杂志社有限公司;同方知网数字出版技术股份有限公司 发明人 张晓博;张斌
分类号 G06K9/00(2006.01)I;G06F17/25(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 北京远大卓悦知识产权代理事务所(普通合伙) 11369 代理人 史霞
主权项 一种扫描版文件在小屏幕设备智能分版的方法,其特征在于,包括以下步骤:(i)利用OCR技术从所述扫描版文件的版面中提取文件的基本内容的信息;(ii)从所述信息中分别识别出所述文件中的版心信息、页眉页脚信息、页码信息以及分隔符信息,所述版心信息包括文本信息、图像信息、表格信息以及公式信息;(iii)过滤掉页眉页脚信息、页码信息以及分隔符信息,保留所述版心信息;(iv)使用阅读顺序排序算法对所述版心信息进行阅读顺序的排序;(v)所述版心信息为母信息,根据设定将所述母信息切割成子信息;(vi)将所述子信息进行二次排序后输出。
地址 100084 北京市海淀区清华园清华大学36区1410、1412、1414
您可能感兴趣的专利