发明名称 |
检测词汇的方法与装置 |
摘要 |
本发明提供一种检测词汇的方法与装置,方法包括:步骤a:提取待检测文本中的待检测字符;步骤b:判断待检测字符是否为干扰词汇,当判断结果为是时,转为步骤c,否则转为步骤d;步骤c:提取待检测文本中与待检测字符相邻的下一个字符作为待检测字符,并转为步骤b;步骤d:将待检测字符作为待组合字符,存储到缓存区;步骤e:根据缓存区中各待组合字符获取待检测词汇;步骤f:判断待检测词汇是否为敏感词。根据本发明的检测词汇的方法与装置,能够通过去除待检测文本中的干扰词汇以有效判断敏感词。 |
申请公布号 |
CN102902766A |
申请公布日期 |
2013.01.30 |
申请号 |
CN201210361942.3 |
申请日期 |
2012.09.25 |
申请人 |
中国联合网络通信集团有限公司 |
发明人 |
胡昌玮;李珩;杨贝斯 |
分类号 |
G06F17/30(2006.01)I;G06F17/22(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同立钧成知识产权代理有限公司 11205 |
代理人 |
刘芳 |
主权项 |
一种检测词汇的方法,其特征在于,包括:步骤a:提取待检测文本中的待检测字符;步骤b:判断所述待检测字符是否为干扰词汇,当判断结果为是时,转为步骤c,否则,转为步骤d;步骤c:提取所述待检测文本中与所述待检测字符相邻的下一个字符作为待检测字符,并转为步骤b;步骤d:将所述待检测字符作为待组合字符,存储到缓存区;步骤e:根据所述缓存区中的各待组合字符获取待检测词汇;步骤f:判断所述待所述检测词汇是否为敏感词。 |
地址 |
100033 北京市西城区金融大街21号 |