发明名称 基于层次式索引的版式可回流文件建立和绘制方法
摘要 本发明涉及一种基于层次式索引的版式可回流文件建立和绘制方法,提出的统一注释技术,通过记录可回流文字的包围框,文本行或文本列参数,区域包围框等来描述版式文件的几何结构,同时赋予每个描述的几何结构一个索引号;为了描述句﹑段落﹑节和章等版式文件中包含的逻辑结构,给每个逻辑结构也赋予一个索引号。这样通过使用几何结构的索引号或逻辑结构的索引号来描述版式文件的逻辑结构和各结构间的阅读优先顺序。实现使用XML语言、SGML语言等标记语言来表示层次式索引结构。各种版式文件都可通过本发明方法来对版式数字书籍进行注释,减少记录容量。通过解析版式数字书籍逻辑结构,将能够使用相同的阅读程序来阅读不同格式的版式数字书籍。
申请公布号 CN103268340B 申请公布日期 2016.08.10
申请号 CN201310188492.7 申请日期 2013.05.21
申请人 龚如宾 发明人 龚如宾
分类号 G06F17/30(2006.01)I;G06F17/21(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海申汇专利代理有限公司 31001 代理人 吴宝根
主权项 一种基于层次式索引的版式可回流文件建立和绘制方法,其特征在于,具体包括如下步骤:基于层次式索引的版式可回流文件建立:1)通过扫描、成像设备或者软件工具得到版式数字书籍页面数据;2)对每张数字书籍页面进行几何版面分析,得到文字段落区域和非文字区域,为每个区域分配一个索引号;对于非文字区域,计算其包围框,包围框形状可为长方形、圆、曲线、椭圆、三角形或者多边形形状,并记录对象包围框坐标或其所包围区域;3)对每个文本段落区域,确定其所包含的行或列,记录行对准线和列对准线,并为每一行或每一列分配一个索引号,此处索引号码的分配按照事先约定的规则来分配;4)对于其中每行,计算行内可回流对象的包围框,对每列,计算列内可回流对象的包围框,并为文本段落区域中的每个可回流对象计算出一个包围框,并记录可回流对象包围框坐标,并为每个可回流对象包围框分配一个索引号,确保行内或列内每个可回流对象包围框有一个索引号码;5)利用版面相关的领域知识,对单张或多张数字书籍页面进行版面识别和理解,得到章,节,标题,子标题,摘要,作者版面逻辑区域信息;6)为每个逻辑区域分配索引号;其中每个逻辑区域包含一个或多个区域,通过记录其所包含区域的索引号来表达区域间的包含关系和从属关系,根据各区域的索引号或索引号码的组合来计算区域间的阅读顺序;对层次式索引的版式可回流文件进行绘制:7)通过网络或者本地存储介质得到版式文件和其层次式索引描述,解析此层次式索引描述;8)根据输出媒体尺寸和需要绘制的样式读入当前绘制需要的版面数据和对应的层次式索引描述数据;9)如果绘制对象区域是非文字区域类型,则根据输出媒体尺寸通过放大或缩小来进行绘制;10)如果绘制对象区域属于文字类型,则根据需要绘制的样式,能够绘制的行宽和列高,字包围区域大小或单词包围区域大小来计算每个区域在行内的横向偏移或列内的纵向偏移;11)计算每个包围区域相对于每条行对准线或列对准线的旋转角度;12)根据计算好的包围区域的位置和旋转角度来绘制对应的包围区域。
地址 200129 上海市浦东新区五莲路1769弄14号602室