发明名称 一种拼音流切分方法和系统
摘要 本发明实施例提供一种拼音流切分方法,所述方法包括:对输入拼音流中按照时间顺序输入的每一个字符,进行如下处理:以所述字符作为结束字符,确定所述字符与在先输入的且与所述字符相邻的0~3个字符组合后的至少一个合法音节;根据所述至少一个合法音节确定以所述字符为结束符的所述输入拼音流的多条拼音切分路径;计算每一条拼音切分路径的路径权值,根据路径权值由大到小的顺序提取预定数量的拼音切分路径,作为以所述字符作为结束符的所述输入拼音流的切分结果。本发明实施例提供的方法应用于输入法,通过对用户输入的拼音流进行切分和纠错,提高了输入法的后续音字转换效率以及音字转换精度。
申请公布号 CN102866783B 申请公布日期 2015.07.15
申请号 CN201110187967.1 申请日期 2011.07.06
申请人 哈尔滨工业大学 发明人 关毅;贾祯
分类号 G06F3/023(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F3/023(2006.01)I
代理机构 北京三友知识产权代理有限公司 11127 代理人 樊一槿
主权项 一种拼音流切分方法,其特征在于,所述方法包括:对输入拼音流中按照时间顺序输入的每一个字符,进行如下处理:以所述字符作为结束字符,确定所述字符与在先输入的且与所述字符相邻的0~3个字符组合后的至少一个合法音节;根据所述至少一个合法音节确定以所述字符为结束符的所述输入拼音流的多条拼音切分路径;计算每一条拼音切分路径的路径权值,根据路径权值由大到小的顺序提取预定数量的拼音切分路径,作为以所述字符作为结束符的所述输入拼音流的切分结果;所述计算每一条拼音切分路径的路径权值,包括:统计所述拼音切分路径的字符中声母的个数和韵母的个数,以及切分路径长度;将所述声母的个数与声母权值的乘积以及所述韵母的个数与韵母权值的乘积相加;将所述相加的结果与第一预定系数的乘积除以所述切分路径长度的平方,得到所述拼音切分路径的路径权值。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号