发明名称 基于统计模型的电力系统哈萨克语专用名词提取方法
摘要 本发明公开了基于统计模型的电力系统哈萨克语专用名词提取方法,①输入哈萨克语文本;②对哈萨克文本进行分词;③将由上述第②步得到的分词结果送到由CRF++建立的专用名词模型,得到标志的专用名词;④通过标志分析工具,根据IOB标志的含义提取专用名词,测试结果表示被提取的哈萨克文专用名词的86%是词根正确的相关电力系统的单词。本发明根据预料的知识提取电力专用名词,并输出结果,应用范围是电力行业专用词典的编辑,电力行业预料中自动提取专用名词,大大减少人工方式分类和提取的时间,劳动力和成本。
申请公布号 CN103885932A 申请公布日期 2014.06.25
申请号 CN201210553919.4 申请日期 2012.12.19
申请人 新疆信息产业有限责任公司 发明人 塔拉甫·加盘;王天军;邹帅
分类号 G06F17/27(2006.01)I;G06F17/28(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 乌鲁木齐新科联知识产权代理有限公司 65107 代理人 祁磊
主权项 一种基于统计模型的电力系统哈萨克语专用名词提取方法,其方法为: ①输入哈萨克语文本;②对哈萨克文本进行分词;③将由上述第②步得到的分词结果送到由CRF++建立的专用名词模型,得到标志的专用名词;④通过标志分析工具,根据IOB标志的含义提取专用名词。
地址 830011 新疆维吾尔自治区乌鲁木齐市新市区河南东路22号新疆在线大厦