发明名称 一种通过关键词检索页面的方法及装置
摘要 本发明公开了一种通过关键词检索页面的方法及装置,涉及计算机及互联网领域,用以降低检索页面的过程中对包含目标关键词但不是目的页面的误判率。方法包括:在页面中检索目标关键词;根据目标关键词在页面中的位置确定该目标关键词所在的段落;在所述段落中检索要剔除的关键词;将检索到要剔除关键词的页面从检索结果中过滤。装置包括:第一检索单元,定位单元,第二检索单元和过滤单元。由于本发明在包含目标关键词的段落中针对要剔除关键词进行了重检索,并将任一段落中同时包含目标关键词和要剔除关键词的页面过滤掉,所以提高了识别目标页面的能力,同时降低误判页面的概率。
申请公布号 CN101777074A 申请公布日期 2010.07.14
申请号 CN201010104946.4 申请日期 2010.01.29
申请人 蓝盾信息安全技术股份有限公司 发明人 柯宗贵;柯宗庆
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种通过关键词检索页面的方法,其特征在于,包括下列步骤:在页面中检索目标关键词;根据目标关键词在页面中的位置确定该目标关键词所在的段落;在所述段落中检索要剔除的关键词;将检索到要剔除关键词的页面从检索结果中过滤。
地址 510630广东省广州市天河区五山路248号金山大厦北塔2层蓝盾公司