发明名称 一种派生词生成方法及系统
摘要 本发明涉及一种派生词生成方法及系统,本发明通过建立派生语法规则数组,将输入的字符信息和派生语法规则数组中的派生语法规则数组进行匹配,获得匹配的派生语法规则数组;再根据获得的派生语法规则数组中的条件数组、以及输入的字符信息从语言数据库获得相匹配的单词;然后在该单词的后面添加上该获得的派生语法规则数组中的后缀字母字符序列从而生成派生词。因此,本发明提供的技术方案通过将语言数据库中的单词利用语法规则生成派生词,不再需要将派生词存储于语言数据库中,从而大大节省了语言数据库的存储空间。
申请公布号 CN101533403A 申请公布日期 2009.09.16
申请号 CN200810218948.9 申请日期 2008.11.07
申请人 广东国笔科技股份有限公司 发明人 高精鍊;陈炳辉
分类号 G06F17/30(2006.01)I;G06F3/023(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 1. 一种派生词生成方法,其包括如下步骤:1)创建若干派生语法规则数组,每组派生语法规则数组包括后缀字母字符序列、要求被派生单词符合的条件数组,该条件数组包括对应该后缀字母字符序列所要求被派生单词具有的词性;2)输入用户字符序列;3)将所述用户字符序列与每组派生语法规则数组进行匹配,获得与该用户字符序列相匹配的派生语法规则数组;4)根据所述用户字符序列从语言数据库中获得单词,且该单词符合所述获得的派生语法规则数组中的条件数组的要求;在获得的单词后面加上后缀字母字符序列生成派生词,该后缀字母字符序列为该单词所符合的条件数组所属派生语法规则数组中的。
地址 510620广东省广州市天河区体育东路122号羊城国际商贸中心西塔1310