发明名称 | UTF-8模式匹配系统和方法 | ||
摘要 | 描述了用于有效地处理、搜索和/或重写可变宽度编码数据的系统和方法,该可变宽度编码数据例如是UTF-8编码数据。系统和方法的实施例修改和改写了诸如Horspool和Wu-Manber算法的搜索算法,以便有效地处理和管理在大块文本中搜索可变宽度编码文本,该大块文本例如可经由通过网络装置的分组流传输的文本,该网络装置例如是中间装置。 | ||
申请公布号 | CN103548022A | 申请公布日期 | 2014.01.29 |
申请号 | CN201280024694.1 | 申请日期 | 2012.03.27 |
申请人 | 思杰系统有限公司 | 发明人 | S·K·杜丽帕拉;S·C·弗农 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京泛华伟业知识产权代理有限公司 11280 | 代理人 | 王勇 |
主权项 | 一种用于在文本块中对可变宽度编码模式进行不区分大小写的搜索的方法,所述方法包括:(a)由装置为模式中的每个字符确定相应的小写统一码值,其中在文本块内为该模式搜索匹配,该模式包括可变宽度编码字符;(b)由所述装置为所述模式建立跳转值的索引表,所述索引表包括到每个相应的小写统一码值的哈希,该哈希标识关于相应字符的多个字节长度;(c)由所述装置响应于跳转值的索引表,基于所述模式的字节长度和所述模式的最后字符的字节长度,将指向所述文本块的指针跳转到所述文本块中的支点元素;以及(d)由所述装置比较所述支点元素的小写统一码值与所述模式的最后字符的字符的相应小写统一码值。 | ||
地址 | 美国佛罗里达州 |