发明名称 | 文本匹配过滤方法及装置 | ||
摘要 | 本发明公开了一种文本匹配过滤方法及装置。所述方法包括:将被测文本中的字符进行独立分割,得到分割后的字符串;将分割后的字符串中的字符分别与倒排字库中的关键字符进行匹配;所述倒排字库是对输入的关键字进行逐字符分解并记录每个关键字符在所述关键字中的位置信息后形成的;按照设定的模糊度确定规则,确定匹配成功的每个关键字中关键字符匹配时用到的模糊度值,得到每个关键字的匹配模糊度;根据每个关键字的匹配模糊度,确定输入的关键字的平均模糊度,根据所述平均模糊度确定所述被测文本是否符合过滤条件。本发明还公开了用于实现所述方法的装置。 | ||
申请公布号 | CN104750673A | 申请公布日期 | 2015.07.01 |
申请号 | CN201310753277.7 | 申请日期 | 2013.12.31 |
申请人 | 中国移动通信集团公司 | 发明人 | 粟栗;张峰 |
分类号 | G06F17/27(2006.01)I | 主分类号 | G06F17/27(2006.01)I |
代理机构 | 北京同达信恒知识产权代理有限公司 11291 | 代理人 | 郭润湘 |
主权项 | 一种文本匹配过滤方法,其特征在于,包括:将被测文本中的字符进行独立分割,得到分割后的字符串;将分割后的字符串中的字符分别与倒排字库中的关键字符进行匹配;所述倒排字库是对输入的关键字进行逐字符分解并记录每个关键字符在所述关键字中的位置信息后形成的;按照设定的模糊度确定规则,确定匹配成功的每个关键字中关键字符匹配时用到的模糊度值,得到每个关键字的匹配模糊度;根据每个关键字的匹配模糊度,确定输入的关键字的平均模糊度,根据所述平均模糊度确定所述被测文本是否符合过滤条件。 | ||
地址 | 100032 北京市西城区金融大街29号 |