发明名称 |
一种音字转换方法和系统 |
摘要 |
本发明实施例提供一种音字转换方法和系统,所述方法包括:整句生成步骤,按照拼音切分路径权重计算规则,对以当前字符结尾的拼音流的所有拼音切分路径排序,选择所述所有拼音切分路径中权重值最高的第一预定数量的拼音切分路径进行整句生成;Unigram出词步骤,对所述以当前字符结尾的拼音流的所有拼音切分路径进行Unigram出词;处理步骤,将所述整句生成结果和所述Unigram出词结果进行去重和排序,获得所述以当前字符结尾的拼音流的音字转换结果。通过本实施例的方法和系统,实现了拼音到汉字的转换,通过将可能的整句或词组或汉字候选去重后按一定顺序排序,提高了整句生成效率。 |
申请公布号 |
CN102866781A |
申请公布日期 |
2013.01.09 |
申请号 |
CN201110187942.1 |
申请日期 |
2011.07.06 |
申请人 |
哈尔滨工业大学 |
发明人 |
关毅;阎于闻 |
分类号 |
G06F3/023(2006.01)I |
主分类号 |
G06F3/023(2006.01)I |
代理机构 |
北京三友知识产权代理有限公司 11127 |
代理人 |
樊一槿 |
主权项 |
一种音字转换方法,其特征在于,所述方法包括:整句生成步骤,按照拼音切分路径权重计算规则,对以当前字符结尾的拼音流的所有拼音切分路径排序,选择所述所有拼音切分路径中权重值最高的第一预定数量的拼音切分路径进行整句生成;Unigram出词步骤,对所述以当前字符结尾的拼音流的所有拼音切分路径进行Unigram出词;处理步骤,将所述整句生成结果和所述Unigram出词结果进行去重和排序,获得所述以当前字符结尾的拼音流的音字转换结果。 |
地址 |
150001 黑龙江省哈尔滨市南岗区西大直街92号 |