发明名称 |
一种基于双向递归神经网络的新企业名称发现方法 |
摘要 |
本发明涉及自然语言处理领域,特别涉及一种基于双向递归神经网络的新企业名称发现方法,本发明通过现有的企业名称数据自动标注样本来训练双向递归神经网络,通过双向递归神经网络的学自动识别待处理文本中的企业名称,并将不属于现有企业名称的新企业名称提取出来,本发明通过对文本的基本元素,比如字、词、标点符号等进行特征的自动学,克服了传统方式中需要手动设置特征的缺陷;不仅如此,本发明应用了双向传播的RNN使得待识别的自然语言序列的分类判断结果依赖了上下文信息,提取和判断的准备率更高,本发明方法通过已有数据特点来发现新的企业实体名称,在大数据分析领域特别是以企业为分析主体的数据分析领域中具有重要的应用价值。 |
申请公布号 |
CN105955954A |
申请公布日期 |
2016.09.21 |
申请号 |
CN201610286706.8 |
申请日期 |
2016.05.03 |
申请人 |
成都数联铭品科技有限公司 |
发明人 |
刘世林;何宏靖 |
分类号 |
G06F17/27(2006.01)I;G06N3/02(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于双向递归神经网络的新企业名称发现方法,其特征在于,通过现有的企业名称数据自动标注样本来训练双向递归神经网络,通过所述双向递归神经网络自动识别出待处理文本中的企业名称,并将其中新企业名称提取出来。 |
地址 |
610041 四川省成都市高新区天府大道中段666号,希顿国际广场B栋1005 |