发明名称 |
短信匹配及去重方法 |
摘要 |
本发明公开了一种短信匹配及去重方法,包括以下步骤:服务器中初始种子短信库为空,短信库对应于一平衡二叉树,且平衡二叉树初始化为空;设置匹配的相似度阈值;对新增的一条待测短信,首先计算该短信匹配成功所需的最少匹配字符数;建立一个匹配数组,长为短信库中已有短信条数,记录待测短信与已有短信的匹配字符数,初始为0;对待测短信进行排序,排序结果为非重复的顺序字符以及对应字符出现的次数,不包含标点符号;在平衡二叉树中查找相应的字符,对排序后的待测短信的每个字符进行匹配,同时更新匹配数组和平衡二叉树;待测短信匹配过程结束后,找出匹配数组中数值大于最少匹配字符数的对应短信序列,进行去重操作。 |
申请公布号 |
CN102662943A |
申请公布日期 |
2012.09.12 |
申请号 |
CN201210015435.4 |
申请日期 |
2012.01.18 |
申请人 |
苏州酷动多媒体科技有限公司 |
发明人 |
曹一清 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市合德专利事务所 11244 |
代理人 |
王文会 |
主权项 |
一种短信匹配及去重方法,其特征在于包括以下步骤:步骤1:服务器中初始短信库为空,所述短信库对应于一平衡二叉树,且平衡二叉树初始化为空;步骤2:设置匹配的相似度阈值;步骤3:对新增的一条待测短信,首先计算该短信匹配成功所需的最少匹配字符数=待测短信长度×相似度阈值;步骤4:其次建立一匹配数组,长为短信库中已有短信条数,记录待测短信与已有短信的匹配字符数,初始为0;步骤5:接着对待测短信进行排序,排序结果为非重复的顺序字符以及对应字符出现的次数N,不包含标点符号;步骤6:在平衡二叉树中查找相应的字符,对排序后的待测短信的每个字符进行匹配,同时更新匹配数组和平衡二叉树;步骤7:待测短信匹配过程结束后,匹配数组中数值与相比较,根据比较的结果进行去重操作。 |
地址 |
215400 江苏省苏州市太仓经济开发区北京西路6号 |