发明名称 |
一种基于最大熵模型建模和命名实体识别的方法及装置 |
摘要 |
本发明公开了一种基于最大熵模型建模和命名实体识别的方法,该方法包括:输入标注命名实体的训练文本;对所述训练文本中的字符进行角色标注,得到训练文本的字符角色标注;根据字符角色标注,建立所述字符的特征项;将所述字符的特征项输入到最大熵的建模工具中,得到基于字符角色标注的数据模型。该方法不需分词,因此解决了进行命名实体识别时,分词错误和它导致的信息丢失而影响识别效果的问题。 |
申请公布号 |
CN101295292A |
申请公布日期 |
2008.10.29 |
申请号 |
CN200710098635.X |
申请日期 |
2007.04.23 |
申请人 |
北大方正集团有限公司;北京大学;北京北大方正技术研究院有限公司 |
发明人 |
王学武;彭学政;杨建武;肖建国 |
分类号 |
G06F17/27(2006.01) |
主分类号 |
G06F17/27(2006.01) |
代理机构 |
北京同达信恒知识产权代理有限公司 |
代理人 |
李欣 |
主权项 |
1、一种基于最大熵模型建模的方法,其特征在于,包括:输入标注命名实体的训练文本;对所述训练文本中的字符进行角色标注,得到带有字符角色标注的训练文本;根据字符角色标注,建立所述字符的特征项;将所述字符的特征项输入到最大熵的建模工具中,得到基于所述字符角色标注的数据模型。 |
地址 |
100871北京市海淀区成府路298号中关村方正大厦513 |