发明名称 一种标记文件解析方法和装置
摘要 本申请提供了一种标记文件解析方法和装置,用以解决现有技术中对标记文件解析成功率低的问题。本申请通过获取标记文件中的标签对象生成标签集合;根据所述标签集合中标签对象的公共属性对所述标签对象进行分组;从所述分组的结果获得一个或多个分组标签;依据预置的标记文件解析映射表,匹配所述一个或多个分组标签中的标签对象的属性;从相匹配的分组标签中获取标记文件解析用的数据。对标签对象按其公共属性进行分组,使得标记文件中原本无序的标签对象之间建立了关联,非常有利于做进一步的匹配分析,有效提高了标记文件的解析成功率。
申请公布号 CN102651019B 申请公布日期 2013.12.04
申请号 CN201210091311.4 申请日期 2012.03.30
申请人 北京奇虎科技有限公司;奇智软件(北京)有限公司 发明人 杭程;李超;万勇;任寰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 苏培华
主权项 一种标记文件解析方法,其特征在于,包括:获取标记文件中的标签对象,生成标签集合;根据所述标签集合中标签对象的公共属性,对所述标签对象进行分组;其中,所述根据所述标签集合中标签对象的公共属性,对所述标签对象进行分组包括:将标签集合中具有相同父节点的标签对象置于同一分组标签内;判断当前分组结果中一个或多个分组标签;若当前分组标签包含两个或多个标签对象,且所述两个或多个标签对象不具有相同的父节点,则将当前分组标签内具有相同父节点的标签对象置于另一分组标签内;重复上述步骤直到当前分组标签不可再分组;从所述分组的结果获得一个或多个分组标签;依据预置的标记文件解析映射表,匹配所述一个或多个分组标签中的标签对象的属性;从相匹配的分组标签中,获取标记文件解析用的数据。
地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)