发明名称 |
命名实体的识别方法 |
摘要 |
本发明提供了命名实体的识别方法,涉及语言识别领域。本发明实施例提供的命名实体的识别方法,采用复合识别的方式,其通过先对每个语句进行分词处理,再在分词的结果基础上(得出待识别词语单位),确认每个待识别词语单位的词性、语言结构和待识别词语单元在不同种类参考命名词典中的出现情况,并且进一步根据参考命名词典中不同待识别词语单元的出现情况(主要是待识别词语单元在哪种参考命名词典中出现了)和词性、语言结构来精确的确认命名实体识别结果,由于为每个待识别词语单位匹配了相对应的参考命名词典,由此,可以根据参考命名词典对待识别词语单位进行更为精确的命名实体识别。 |
申请公布号 |
CN104572625A |
申请公布日期 |
2015.04.29 |
申请号 |
CN201510030187.4 |
申请日期 |
2015.01.21 |
申请人 |
北京云知声信息技术有限公司 |
发明人 |
孙孝雄 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京超凡志成知识产权代理事务所(普通合伙) 11371 |
代理人 |
王术兰 |
主权项 |
命名实体的识别方法,其特征在于,包括:对预先获取的待分词语句进行分词,以确定一个或多个待识别词语单位;确认指定的待识别词语单位的词性、语言结构和记载有待识别词语单位的参考命名词典;根据所述待识别词语单位的词性、语言结构和所述待识别词语单元在不同种类参考命名词典中的出现情况,确定每个待识别词语单位的命名实体识别结果。 |
地址 |
100000 北京市海淀区花园路2号牡丹科技楼五层A503 |