发明名称 |
一种自定义提取目录内容的方法和装置 |
摘要 |
本发明涉及自定义提取目录内容的方法和装置,其中的方法包括:按照特定的结构化规则,形成符合规范的设置有多个标签的结构化数据文档,提取结构化数据文档中的与目录级别相对应的标签,将目录级别与提取的标签相对应;针对目录级别对应的标签的附加内容,从结构化数据文档中提取相应的标签作为附加内容;从结构化数据文档中提取各目录级别对应的标签的数据内容,并按照目录的设置信息将数据内容组织成为目录数据;在提取的标签的数据内容发生变化时,根据各目录级别与标签的对应关系自动更新所述目录数据。采用本发明所述的方法和装置可以将多种内容同时添加到目录中,还可以支持目录全部内容的自动更新,特别适用于科技期刊等出版物的排版过程。 |
申请公布号 |
CN104424214A |
申请公布日期 |
2015.03.18 |
申请号 |
CN201310370392.6 |
申请日期 |
2013.08.22 |
申请人 |
北大方正集团有限公司;方正信息产业控股有限公司;北京北大方正电子有限公司 |
发明人 |
周炜 |
分类号 |
G06F17/30(2006.01)I;G06F17/25(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京英赛嘉华知识产权代理有限责任公司 11204 |
代理人 |
王达佐 |
主权项 |
一种自定义提取目录内容的方法,其特征在于,包括:A、按照特定的结构化规则,形成符合规范的结构化数据文档,所述结构化数据文档中设置有多个标签;B、提取结构化数据文档中的与目录级别相对应的标签,并将所述目录级别与所述提取的标签相对应;C、针对所述目录级别对应的标签的附加内容,从结构化数据文档中提取相应的标签,以作为所述附加内容;D、从结构化数据文档中提取各目录级别对应的标签的数据内容,并按照目录的设置信息将所述数据内容组织成为目录数据;E、在所述提取的标签的数据内容发生变化时,根据各目录级别与标签的对应关系自动更新所述目录数据。 |
地址 |
100871 北京市海淀区成府路298号方正大厦5层 |