发明名称 基于版式文件的文档流式信息处理方法及装置
摘要 本发明公开了一种基于版式文件的文档流式信息处理方法及装置,具体公开了如下技术方案:获得版式文件的文档流式信息,所述文档流式信息为所述版式文件中文档内容结构信息和/或所述版式文件中文档版面自适应呈现信息;根据所述获得的文档流式信息,对所述版式文件的文档内容进行内容块划分;描述所述版式文件的内容块划分结果信息;根据所述内容块划分结果信息,描述基于内容块划分后的该版式文件的文档流式信息。从而使得描述版式文件的文档流式信息更加切实可行,可以灵活对版式文件中的任意内容进行文档流式信息的描述,描述范围更加准确,并且文档流式信息的处理更加灵活、简化。
申请公布号 CN101308488B 申请公布日期 2010.06.02
申请号 CN200810114437.2 申请日期 2008.06.05
申请人 北京大学;北大方正集团有限公司;北京方正阿帕比技术有限公司 发明人 仇睿恒;王毅;汤帜
分类号 G06F17/21(2006.01)I 主分类号 G06F17/21(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 黄志华
主权项 一种基于版式文件的文档流式信息处理方法,其特征在于,包括:获得版式文件的文档流式信息,所述文档流式信息为所述版式文件中文档内容结构信息和/或所述版式文件中文档版面自适应呈现信息;根据所述获得的文档流式信息,对所述版式文件的文档内容进行内容块划分;描述所述版式文件的内容块划分结果信息;根据所述内容块划分结果信息,描述基于内容块划分后的该版式文件的文档流式信息,其中描述基于内容块划分后的该版式文件的文档流式信息,是指描述各内容块本身的文档流式信息和各内容块之间的关系。
地址 100871 北京市海淀区颐和园路5号