发明名称 基于自学排列的排列语料库的生成装置及其方法、使用排列语料库的破坏性表达语素分析装置及其语素分析方法
摘要 本发明公开基于自学排列的排列语料库的生成装置及其方法、使用排列语料库的破坏性表达语素分析装置及其语素分析方法。语素分析装置包括知识数据库和分析器。知识数据库储存有在按语言的语素分析中使用的多个知识信息,包括:语素词典,储存与正常表达对应的语素信息;排列语料库,储存与破坏性表达对应的正常表达信息,其中破坏性表达是拼写错误或者没有规范化和标准化的表达。分析器对所输入的语节使用所述知识数据库进行语素分析并输出分析结果,当在所述语素词典中不存在输入语节的语素时,对在所述输入语节中包含的破坏性表达使用所述排列语料库查找与所述破坏性表达对应的正常表达并进行语素分析。
申请公布号 CN105593845A 申请公布日期 2016.05.18
申请号 CN201480054951.5 申请日期 2014.08.27
申请人 系统翻译国际有限公司 发明人 池昌真
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 梁洪源;康泉
主权项 一种排列语料库的生成方法,包括步骤:构建双语语料库,所述双语语料库储存由包含破坏性表达的破坏性句子和与该破坏性句子对应的正常句子组成的句子对,其中所述破坏性表达是拼写错误或者没有规范化和标准化的表达;及对所述双语语料库进行基于自学的排列,从而生成由破坏性表达及与该破坏性表达对应的正常表达排列而成的排列语料库。
地址 韩国首尔
您可能感兴趣的专利