发明名称 HTML片段的检测方法
摘要 本申请公开了HTML片段的检测方法,该方法中利用专门的单标签参数S来记录当前检测位置之前最近的一个单标签,利用集合Z来记录当前已遍历到的但未匹配的所有开始标签,基于这些参数进行标签的匹配,并且,在检测到结束标签时,优先将其与最近一次检测到的单标签进行匹配,在无法匹配的情况下再进行双标签的匹配,在检测到错误时进行具体错误及错误位置的通知。本发明既可以对HTML片段中的单、双标签进行准确识别,同时还兼容由单标签与结束标签组成的双标签的格式,因此,采用本发明可以有效提高检测的准确度,并能对错误进行准确定位。
申请公布号 CN103745003B 申请公布日期 2017.01.25
申请号 CN201410035578.0 申请日期 2014.01.24
申请人 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 发明人 王海昕
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 王一斌;王琦
主权项 一种HTML片段的检测方法,其特征在于,包括:a、将需要检测的HTML片段的首个标签作为当前的待检测标签;将单标签参数S的初始值设置为空;将用于记录当前未匹配的开始标签的集合Z设置为空;b、判断当前的待检测标签M是否为空,如果是,则执行步骤c;否则,执行步骤d;c、判断所述集合Z是否为空,如果是,则结束所述检测方法;否则,判定所述集合Z中的所有开始标签没有对应的结束标签并且通知系统,结束所述检测方法;d、判断所述M是否为单标签,如果是,则将当前的单标签参数S的值设置为所述M的值,执行步骤g;否则,判断所述M是否为开始标签,如果是,则将所述M置入所述集合Z中,将所述S的值设置为空,执行步骤g,否则,执行步骤e;e、判断所述S的值是否等于所述M的值,如果是,则将所述S的值设置为空,执行步骤g;否则,将所述S的值设置为空,执行步骤f;f、判断所述集合Z是否为空,如果是,则判定所述M处存在多余的结束标签并通知系统,结束所述检测方法;否则,取出最后进入所述集合Z的标签N,将所述标签N从所述集合中删除,判断所述N与所述M的值是否相等,如果是,则执行步骤g,否则,判定所述M处没有与所述N对应的结束标签并通知系统,结束所述检测方法;g、将所述HTML片段中所述M之后的下一个标签作为当前的待检测标签,执行所述步骤b。
地址 100080 北京市海淀区苏州街20号2号楼2层