发明名称 |
词汇识别方法和词汇识别系统 |
摘要 |
本发明提出了一种词汇识别方法和一种词汇识别系统,其中,所述词汇识别方法包括:根据接收到的词汇识别命令,从待处理文本中获取多个候选关键词,并将多个候选关键词发送至统计单元;通过统计单元接收多个候选关键词,统计多个候选关键词的参数信息,并将多个候选关键词的参数信息发送至识别单元;通过识别单元接收参数信息,并根据多个候选关键词的参数信息,对多个候选关键词进行过滤,以识别目标关键词。通过本发明的技术方案,可以比较全面地获取候选关键词,从而可以从候选关键词中比较全面地识别流行词等新词,进而可以通过识别出的流行词等新词来发现网络热点和分析舆论走向。 |
申请公布号 |
CN106484672A |
申请公布日期 |
2017.03.08 |
申请号 |
CN201510536145.8 |
申请日期 |
2015.08.27 |
申请人 |
北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
发明人 |
刘克松;杨建武 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京友联知识产权代理事务所(普通合伙) 11343 |
代理人 |
尚志峰;汪海屏 |
主权项 |
一种词汇识别方法,其特征在于,包括:根据接收到的词汇识别命令,从待处理文本中获取多个候选关键词,并将所述多个候选关键词发送至统计单元;通过所述统计单元接收所述多个候选关键词,统计所述多个候选关键词的参数信息,并将所述多个候选关键词的所述参数信息发送至识别单元;通过所述识别单元接收所述参数信息,并根据所述多个候选关键词的所述参数信息,对所述多个候选关键词进行过滤,以识别目标关键词。 |
地址 |
100871 北京市海淀区成府路298号方正大厦9层 |