发明名称 短信匹配及去重方法
摘要 本发明公开了一种短信匹配及去重方法,包括以下步骤:服务器中初始种子短信库为空,短信库对应于一平衡二叉树,且平衡二叉树初始化为空;设置匹配的相似度阈值;对新增的一条待测短信,首先计算该短信匹配成功所需的最少匹配字符数;建立一个匹配数组,长为短信库中已有短信条数,记录待测短信与已有短信的匹配字符数,初始为0;对待测短信进行排序,排序结果为非重复的顺序字符以及对应字符出现的次数,不包含标点符号;在平衡二叉树中查找相应的字符,对排序后的待测短信的每个字符进行匹配,同时更新匹配数组和平衡二叉树;待测短信匹配过程结束后,找出匹配数组中数值大于最少匹配字符数的对应短信序列,进行去重操作。
申请公布号 CN102662943B 申请公布日期 2014.06.18
申请号 CN201210015435.4 申请日期 2012.01.18
申请人 苏州酷动多媒体科技有限公司 发明人 曹一清
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市合德专利事务所 11244 代理人 王文会
主权项 一种短信匹配及去重方法,其特征在于包括以下步骤:步骤1:服务器中初始短信库为空,所述短信库对应于一平衡二叉树,且平衡二叉树初始化为空;步骤2:设置匹配的相似度阈值;步骤3:对新增的一条待测短信,首先计算该短信匹配成功所需的最少匹配字符数=待测短信长度×相似度阈值;步骤4:其次建立一匹配数组,长为短信库中已有短信条数,记录待测短信与已有短信的匹配字符数,初始为0;步骤5:接着对待测短信进行排序,排序结果为非重复的顺序字符以及对应字符出现的次数N,不包含标点符号;步骤6:在平衡二叉树中查找相应的字符,对排序后的待测短信的每个字符进行匹配,同时更新匹配数组和平衡二叉树;步骤7:待测短信匹配过程结束后,匹配数组中的数值与最少匹配字符数相比较,根据比较的结果进行去重操作;所述步骤7中的去重操作包括以下步骤:步骤7.1:匹配数组中数值大于最少匹配字符数的对应短信序列即为自定义的重复短信,其匹配相似度=匹配数值÷短信长度,则服务器不保存该条短信,且只将短信号码、已有的重复短信序号以及相应的匹配相似度发送给手机用户;步骤7.2:若匹配数组中数值小于最少匹配字符数的对应短信序列,即匹配相似度小于自定义阈值,则不存在自定义的重复短信,服务器保存该条短信,并将该短信以及短信号码直接发送给手机用户。
地址 215400 江苏省苏州市太仓经济开发区北京西路6号