发明名称 |
版式文件的结构处理方法和系统 |
摘要 |
本发明公开一种版式文件逻辑结构信息的表示方法和系统,涉及计算机信息处理技术中版式文件的信息表示方法和系统。本发明通过获取版式文件的逻辑结构信息和内容参考序列;根据所述逻辑结构信息将所述内容参考序列划分为多个内容参考子序列,并生成相应的内容划分描述文件;根据所述逻辑结构信息生成逻辑单元描述文件;将所述内容划分描述文件与逻辑单元描述文件进行关联;以及根据所述内容划分描述文件与逻辑单元描述文件的关联对上述处理后的所述版式文件进行文档处理。本发明可以有效、灵活地表示版式文件的逻辑结构信息,使对版式文件的结构处理更加灵活、满足用户需求。 |
申请公布号 |
CN101271463B |
申请公布日期 |
2014.03.26 |
申请号 |
CN200710123338.6 |
申请日期 |
2007.06.22 |
申请人 |
北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
发明人 |
曲径;何震生;王毅;张力 |
分类号 |
G06F17/30(2006.01)I;G06F17/21(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京康信知识产权代理有限责任公司 11240 |
代理人 |
吴贵明 |
主权项 |
一种版式文件的结构处理方法,其特征在于,包括如下步骤:获取版式文件的逻辑结构信息和内容参考序列;根据所述逻辑结构信息将所述内容参考序列划分为多个内容参考子序列,并生成相应的内容划分描述文件;根据所述逻辑结构信息生成逻辑单元描述文件;将所述内容划分描述文件与逻辑单元描述文件进行关联;以及根据所述内容划分描述文件与逻辑单元描述文件的关联对上述处理后的所述版式文件进行文档处理,所述文档处理包括以下至少一种处理:信息提取、重排页面、转换为其他格式的文件。 |
地址 |
100871 北京市海淀区成府路298号方正大厦5层 |