发明名称 |
一种用于中文字符串匹配的位向量方法 |
摘要 |
一种用于中文字符串匹配的位向量方法,对在计算机中用两个字节表示的汉字:将两个字节分别对应一个高字节整数和一个低字节整数进行处理,所有汉字对应的高字节整数和低字节整数分别构成一个高字节数组和低字节数组;将两个字节数组中的所有整数全部清为0;扫描整个中文模式串,对其中的每个汉字做如下操作,设某汉字在中文模式串中所处位置为p,则将该汉字的低字节对应的低字节数组中的整数的第p比特置1并将该汉字的高字节对应的高字节数组中的整数的第p比特置1;用正在处理字符串中的字符在两个整数数组中对应的整数进行匹配。由于采取了将汉字的两个字节分别处理的技术措施,大大减少了所需的空间。 |
申请公布号 |
CN1542614A |
申请公布日期 |
2004.11.03 |
申请号 |
CN03113380.0 |
申请日期 |
2003.05.01 |
申请人 |
中兴通讯股份有限公司 |
发明人 |
陈开渠;赵洁;彭志威 |
分类号 |
G06F9/45 |
主分类号 |
G06F9/45 |
代理机构 |
|
代理人 |
|
主权项 |
1、一种用于中文字符串匹配的位向量方法,对在计算机中用两个字节表示的汉字:(1)将两个字节分别对应一个高字节整数和一个低字节整数进行处理,所有汉字对应的高字节整数和低字节整数分别构成一个高字节数组和低字节数组;(2)将低字节数组和高字节数组中的所有整数全部清为0;(3)从头到尾扫描整个中文模式串,对其中的每个汉字做如下操作,设某汉字在中文模式串中所处位置为p,则首先,将该汉字的低字节对应的低字节数组中的整数的第p比特置1;其次,将该汉字的高字节对应的高字节数组中的整数的第p比特置1;(4)用正在处理字符串中的字符在两个整数数组中对应的整数进行匹配。 |
地址 |
518057深圳市南山区高新技术产业园科技南路中兴通讯大厦法律部 |