发明名称 |
一种网络账号快速检索的分词方法 |
摘要 |
本发明提供一种网络账号快速检索的分词方法,包括以下步骤:步骤一,连字符的搜集:搜集连接英文和数字字符的符号以及符号出现的频率;步骤二,定义连字符集合;步骤三,处理连字符;步骤四,对账号分词。本发明分词连字符的定义及分词时对连字符的特殊处理,可将带有连字符的账号切分成一个独立的词,在检索倒排时只需查找一个词,提高检索速度。 |
申请公布号 |
CN104573055A |
申请公布日期 |
2015.04.29 |
申请号 |
CN201510030273.5 |
申请日期 |
2015.01.21 |
申请人 |
南京烽火星空通信发展有限公司 |
发明人 |
王武韬;史波良;魏世凯;王栋平 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
南京经纬专利商标代理有限公司 32200 |
代理人 |
杨海军 |
主权项 |
一种网络账号快速检索的分词方法,其特征在于,包括以下步骤:步骤一,连字符的搜集:搜集连接英文和数字字符的符号以及符号出现的频率;步骤二,定义连字符集合;步骤三,处理连字符;步骤四,对账号分词。 |
地址 |
210019 江苏省南京市建邺区云龙山路88号烽火科技大厦A栋26F |