发明名称 |
基于双向递归神经网络的信息分析系统 |
摘要 |
本发明涉及自然语言处理领域,特别涉及基于双向递归神经网络的信息分析系统,包含双向递归神经网络模块,所述系统通过双向递归神经网络模块将待分析文本中的企业名称分段识别为开始部分、关键字部分、行业部分和组织形式部分,并将其中关键字部分作为企业简称提取出来放入企业简称库中。本发明系统通过分词处理将待处理文本序列化,并通过词典映射表将分词后的字、词或者标点符号转化成向量数据输入到所述双向递归神经网络中,打破了自然语言与神经网络的壁垒;在识别企业名称时即依赖前文信息又依赖后文信息,准确率更高,在识别企业名称的基础上识别出企业简称并建立相应的企业简称数据库,为非正式文本的相关信息分析提供有力的技术支撑。 |
申请公布号 |
CN105975455A |
申请公布日期 |
2016.09.28 |
申请号 |
CN201610283887.9 |
申请日期 |
2016.05.03 |
申请人 |
成都数联铭品科技有限公司 |
发明人 |
刘世林;何宏靖 |
分类号 |
G06F17/27(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
基于双向递归神经网络的信息分析系统,包含双向递归神经网络模块,其特征在于,所述系统通过双向递归神经网络模块将待分析文本中的企业名称分段识别为开始部分、关键字部分、行业部分和组织形式部分,并将其中关键字部分作为企业简称提取出来放入企业简称库中。 |
地址 |
610041 四川省成都市高新区天府大道中段666号,希顿国际广场B栋1005 |