发明名称 字符串匹配系统及方法
摘要 本发明提供一种字符串匹配系统及方法,字符串匹配系统存储有若干关键维度和若干非关键维度,每一关键维度和非关键维度均对应有权重值,字符串匹配系统包括输入模块、分词模块、标注模块、比较模块、计算模块和输出模块;输入模块用于接收两个字符串的输入;分词模块用于将两个字符串分词为词组;标注模块用于标注每一词组对应的关键维度或非关键维度;比较模块用于比较两个字符串中的词组,若任一关键维度上的两个词组不相同则调用输出模块输出一字符串不匹配信息,否则调用计算模块用于通过公式<img file="DDA0000455348510000011.GIF" wi="301" he="175" />计算两个字符串之间的匹配度,并调用输出模块输出匹配度。本发明能够快速灵活、准确的计算出字符串之间的匹配度。
申请公布号 CN104778171A 申请公布日期 2015.07.15
申请号 CN201410011078.3 申请日期 2014.01.10
申请人 携程计算机技术(上海)有限公司 发明人 叶亚明;王威振
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海弼兴律师事务所 31283 代理人 薛琦;王婧荷
主权项 一种字符串匹配系统,其特征在于,其存储有若干关键维度和若干非关键维度,每一关键维度和非关键维度均对应有权重值,该字符串匹配系统包括一输入模块、一分词模块、一标注模块、一比较模块、一计算模块和一输出模块;该输入模块用于接收两个字符串的输入;该分词模块用于将该两个字符串分词为词组;该标注模块用于标注每一词组对应的关键维度或非关键维度;该比较模块用于比较该两个字符串中的词组,若任一关键维度上的两个词组不相同则调用该输出模块输出一字符串不匹配信息,否则调用该计算模块;该计算模块用于通过公式<img file="FDA0000455348480000011.GIF" wi="310" he="186" />计算该两个字符串之间的匹配度,并调用该输出模块输出该匹配度;其中n表示该两个字符串中词组相同的个数,a<sub>i</sub>为该两个字符串中第i个相同的词组对应的权重值的两倍,B为该两个字符串中每一词组对应的权重值的累加和。
地址 200335 上海市长宁区福泉路99号携程网络技术大楼