发明名称 |
基于统计模型的电力系统哈萨克语专用名词提取方法 |
摘要 |
本发明公开了基于统计模型的电力系统哈萨克语专用名词提取方法,①输入哈萨克语文本;②对哈萨克文本进行分词;③将由上述第②步得到的分词结果送到由CRF++建立的专用名词模型,得到标志的专用名词;④通过标志分析工具,根据IOB标志的含义提取专用名词,测试结果表示被提取的哈萨克文专用名词的86%是词根正确的相关电力系统的单词。本发明根据预料的知识提取电力专用名词,并输出结果,应用范围是电力行业专用词典的编辑,电力行业预料中自动提取专用名词,大大减少人工方式分类和提取的时间,劳动力和成本。 |
申请公布号 |
CN103885932A |
申请公布日期 |
2014.06.25 |
申请号 |
CN201210553919.4 |
申请日期 |
2012.12.19 |
申请人 |
新疆信息产业有限责任公司 |
发明人 |
塔拉甫·加盘;王天军;邹帅 |
分类号 |
G06F17/27(2006.01)I;G06F17/28(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
乌鲁木齐新科联知识产权代理有限公司 65107 |
代理人 |
祁磊 |
主权项 |
一种基于统计模型的电力系统哈萨克语专用名词提取方法,其方法为: ①输入哈萨克语文本;②对哈萨克文本进行分词;③将由上述第②步得到的分词结果送到由CRF++建立的专用名词模型,得到标志的专用名词;④通过标志分析工具,根据IOB标志的含义提取专用名词。 |
地址 |
830011 新疆维吾尔自治区乌鲁木齐市新市区河南东路22号新疆在线大厦 |