发明名称 一种依存结构树库获取方法及系统
摘要 本发明公开一种依存结构树库获取方法及系统,包括:调用第一树库,采用第一树库的转换工具将第一树库中的短语结构转换为依存结构;利用句法分析器对第一树库中的扁平结构的短语结构转换为依存结构;利用训练得到的依存关系映射模型,对第一树库中的依存结构进行依存关系转换,得到第二树库类型的依存结构树库,使得转换后的树库能与原有的依存结构树库合并,增大树库规模,提高句法分析器的性能。
申请公布号 CN106598951A 申请公布日期 2017.04.26
申请号 CN201611208593.6 申请日期 2016.12.23
申请人 北京金山办公软件股份有限公司;珠海金山办公软件有限公司 发明人 武英波;杜建平;吕坤河
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王宝筠
主权项 一种依存结构树库获取方法,其特征在于,该方法包括:调用第一树库;所述第一树库为汉语短语结构树库;分别采用第一树库的转换工具以及句法分析器,将所述第一树库中的短语结构转换为依存结构;所述第二树库为依存结构的树库;其中,采用第一树库的转换工具将所述第一树库中的短语结构转换为依存结构包括:利用所述转换工具所提供的将第一树库中的短语结构转换为依存结构的规则,或对所述规则进行修正后所得到的规则,将所述短语结构转换为依存结构;以及,基于规则的方法进行归纳,将所述第一树库中的并列结构的短语结构转换为依存结构;其中,采用句法分析器,将所述第一树库中的短语结构转换为依存结构包括:利用句法分析器,将所述第一树库中的扁平结构的短语结构转换为依存结构;利用训练得到的依存关系映射模型,对所述第一树库中的依存结构进行依存关系转换,得到第二树库类型的依存结构树库。
地址 100085 北京市海淀区小营西路33号二层商业办公C区