发明名称 一种快速匹配短信文本的方法
摘要 本发明涉及一种快速匹配短信文本的方法,其特征在于:将需要匹配的短信文本通过“,、。”等中英文标点符号分割形成一个个碎片,并将这些碎片通过Hash算法计算出Hash值,在进行匹配时,将源短信文本的各碎片的Hash值和目标短信文本的各碎片的Hash值进行比较,通过相似度来控制输出匹配结果;本发明不仅提高了跟踪匹配的效率,而且可以满足海量短信话单的匹配要求,具有较好的实用价值。
申请公布号 CN101398837B 申请公布日期 2011.05.11
申请号 CN200810071982.8 申请日期 2008.10.23
申请人 深圳市奇迹通讯有限公司 发明人 吴仁平
分类号 G06F17/30(2006.01)I;H04W4/14(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 福州元创专利商标代理有限公司 35100 代理人 蔡学俊
主权项 一种快速匹配短信文本的方法,其特征在于:将需要匹配的短信文本通过“,、。”中英文标点符号分割形成一个个碎片,并将这些碎片通过Hash算法计算出Hash值,在进行匹配时,将源短信文本的各碎片的Hash值和目标短信文本的各碎片的Hash值进行比较,通过相似度来控制输出匹配结果;具体包括以下步骤:a)将每条源短信文本按照“,、。”中英文标点符号分割成一个个碎片,并计算这些碎片的Hash值,并将这些Hash值存于内存中;b)以FTP方式从短信中心或其他存储短信话单文件的服务器上获取短信话单,并加载、提取话单文件中每条通话记录中的短信内容,将这些短信内容按照“,、。”中英文标点符号分割成一个个碎片,并计算这些碎片的Hash值;c)将目标短信文本的每个碎片的Hash值与源短信文本的每段短信的每个碎片的Hash值进行比较;d)通过比较后,如相似度大于系统设定的值,则进行下一条目标短信内容比较;e)如发现相似度不满足系统设定的值,则进行下一条源短信内容比较匹配,直到找到相似度满足系统设定的值,并将结果输出。
地址 201203 上海市浦东张江高科技园碧波路690号7号楼502室