发明名称 一种实现中文短信模糊匹配关键字的方法
摘要 本发明公开了一种实现中文短信模糊匹配关键字的方法,该方法基于一导入了包括拆分字组合字典、形近字转换字典、繁简体转换字典、汉字拼音字典和近音转换字典的系统,所述方法包括以下步骤:关键字设置;关键字模糊转换;短信采集;短信内容模糊转换;匹配有效性检查;匹配结果输出。本发明根据设定各个功能配置的组合,调整各个关键字转换功能的启用/关闭状态,以达到最佳匹配效果,能做到各级模糊匹配,实现高效、准确的短信内容过滤,提高垃圾短信过滤的查全率。
申请公布号 CN102323929A 申请公布日期 2012.01.18
申请号 CN201110242396.7 申请日期 2011.08.23
申请人 上海粱江通信技术有限公司 发明人 肖克华
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海兆丰知识产权代理事务所(有限合伙) 31241 代理人 章蔚强
主权项 一种实现中文短信模糊匹配关键字的方法,其特征在于,所述方法基于一导入了包括拆分字组合字典、形近字转换字典、繁简体转换字典、汉字拼音字典和近音转换字典的系统,所述方法包括以下步骤:步骤S1,关键字设置,录入需要过滤的关键字;步骤S2,关键字模糊转换,按照所述关键字的功能开关组合,转换该关键字为各级别的模糊关键字;所述关键字的功能开关组合包括以下功能中的一个或多个:中文繁简体转换功能、中文转拼音功能、近音转换功能、形近字转换功能、拆分字组合功能和干扰字符过滤功能;步骤S3,短信采集,将需要匹配的短信输入所述系统;步骤S4,短信内容模糊转换,按照所述模糊关键字所处的级别,将所述短信的内容转换成与所述模糊关键字同一级别的模糊短信;步骤S5,匹配有效性检查,将转换后的所述模糊短信与转换后的所述模糊关键字匹配;步骤S6,匹配结果输出,如果步骤S5中所述模糊短信与所述模糊关键字有相互匹配的字符,则过滤此条短信;否则判定为正常短信,对此短信做放通处理;继续处理下一条短信。
地址 200070 上海市闸北区共和新路912号1001甲室