发明名称 |
词素分析装置、词素分析方法以及词素分析程序 |
摘要 |
对于包含已知词以及未知词的任何一个的句子可以实施词素分析,实现适当的最优解搜索或词素辞典的有效的创建。本发明的词素分析装置,包括:词缀复原部件,基于既定的词缀复原规则来变换输入句中单词的词缀;词素分析候补生成部件,对由词缀复原部件复原了词缀的单词串,进行词素分割以及该词素的词类赋予,并生成一个或者多个词素分析候补;生成概率计算部件,就已生成的各词素分析候补,基于词缀复原前的单词被变换成复原后的单词的概率和从词缀复原后的单词串而生成词素串以及词类串的概率之积,来求解各词素分析候补的生成概率;以及解搜索部件,从由生成概率计算部件计算了生成概率的各词素分析候补之中、将正确度最高的候补作为解来进行搜索。 |
申请公布号 |
CN1936886A |
申请公布日期 |
2007.03.28 |
申请号 |
CN200610154216.9 |
申请日期 |
2006.09.15 |
申请人 |
冲电气工业株式会社 |
发明人 |
中川哲治 |
分类号 |
G06F17/27(2006.01);G06F17/28(2006.01);G06F17/30(2006.01) |
主分类号 |
G06F17/27(2006.01) |
代理机构 |
中国国际贸易促进委员会专利商标事务所 |
代理人 |
曲瑞 |
主权项 |
1.一种词素分析装置,其特征在于,包括:词缀复原部件,基于既定的词缀复原规则来变换输入句中单词的词缀;词素分析候补生成部件,对由词缀复原部件复原了词缀的单词串,进行词素分割以及该词素的词类赋予,并生成一个或者多个词素分析候补;生成概率计算部件,就已生成的上述各词素分析候补,基于词缀复原前的单词被变换成复原后的单词的概率和从词缀复原后的单词串而生成词素串以及词类串的概率之积,来求解上述各词素分析候补的生成概率;以及解搜索部件,从由上述生成概率计算部件计算了生成概率的上述各词素分析候补之中、将正确度最高的候补作为解来进行搜索。 |
地址 |
日本东京 |