发明名称 一种关键词模糊匹配的方法及装置
摘要 本发明公开了一种关键词模糊匹配的方法:对待匹配文本中的每个字符,分别根据关键词集合获取字符所属的关键词以及字符在所属关键词中的索引位;判断该字符是否为所述关键词的首字符;如果是,则在匹配信息集合中记录字符所属关键词,并在记录中标记关键词的首字符存在于所述待匹配文本中;如果不是,且匹配信息集合中存在所述字符所属关键词的记录时,获取字符所属关键词的记录,并在记录中标记所述关键词中的字符存在于待匹配文本中;当一关键词中的各字符都被标记存在于待匹配文本中时,则判定待匹配文本命中所述关键词。本发明还公开了一种关键词模糊匹配的装置,在一定程度上能够解决现有关键词匹配效率低的缺陷。
申请公布号 CN105550298A 申请公布日期 2016.05.04
申请号 CN201510921094.0 申请日期 2015.12.11
申请人 北京搜狗科技发展有限公司 发明人 李剑;毛宏
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京华沛德权律师事务所 11302 代理人 马苗苗
主权项 一种关键词模糊匹配的方法,其特征在于,包括:对待匹配文本中的每个字符,分别根据关键词集合获取所述字符所属的关键词以及所述字符在所属关键词中的索引位;依据所述字符在所属关键词中的索引位判断所述字符是否为所述关键词的首字符;如果所述字符是所属关键词的首字符,则在匹配信息集合中记录所述字符所属关键词,并在记录中标记所述关键词的首字符存在于所述待匹配文本中;如果所述字符不是所属关键词的首字符,且所述匹配信息集合中存在所述字符所属关键词的记录时,获取所述字符所属关键词的记录,并在所述记录中标记所述关键词中的所述字符存在于所述待匹配文本中;当一关键词中的各字符都被标记存在于所述待匹配文本中时,则判定所述待匹配文本命中所述关键词。
地址 100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间