发明名称 一种汉字输入方法和装置
摘要 本发明的实施例提供了一种汉字输入方法和装置,可解决现有技术汉字输入速度慢的问题。所述方法包括:获取拼音串;根据词典对所述拼音串进行切分以获得拼音串的拼音子串;根据词典获取与拼音子串对应的候选词条,以及该候选词条对应的出现概率、其它词条出现条件下该候选词条的出现概率、该候选词条的词性;根据上述候选词条自左向右计算每一候选词条的权重;并根据候选词条的权重确定输入结果。本发明的实施例,由于考虑了词的词性,由于词性有一定的约束关系,通过这种约束关系,会提高了输入拼音串对应汉字的正确性,进而提高了输入速度。
申请公布号 CN102103416B 申请公布日期 2012.10.10
申请号 CN200910261064.6 申请日期 2009.12.17
申请人 新浪网技术(中国)有限公司 发明人 蔡衡;董恭谨;李洋
分类号 G06F3/023(2006.01)I 主分类号 G06F3/023(2006.01)I
代理机构 中国商标专利事务所有限公司 11234 代理人 万学堂
主权项 一种汉字输入方法,其特征在于,包括:获取拼音串;根据词典对所述拼音串进行切分以获得拼音串的拼音子串,所述词典包括词条、词条对应的拼音、词条的出现概率、其它词条出现条件下该词条的出现概率、词性、词性之间的条件概率;从词典中获取与拼音子串对应的候选词条,以及该候选词条对应的出现概率、其它词条出现条件下该候选词条的出现概率、该候选词条的词性;根据候选词条的出现概率、其它词条出现条件下该候选词条的出现概率、所述候选词条的词性自左向右计算每一候选词条的权重,该权重的计算公式如下:Weight(Ai)=max(Weight(Ai‑1)+(a×log(P(Ai|Ai‑1))+b×log(P(Ai))+c×log(P(Prop(Ai)|Prop(Ai‑1)))))其中,i=1到M,M为拼音串被切分为单个汉字所对应的拼音子串的数目;Ai代表第i个位置的词条,Weight(Ai)表示词条Ai的权重,a、b、c是常数;P(Ai| Ai‑1)是指在词条Ai‑1的条件下Ai出现的概率;P(Ai)是词条Ai出现的概率,Prop(A)是词条A的词性;P(Prop(Ai)|Prop(Ai‑1))是在Ai‑1的词性Prop(Ai‑1)出现的条件下Ai的词性Prop(Ai)出现的概率;从包括拼音串的最后拼音子串对应的所有候选词条的权重中,找出权重最大的候选词条,从拼音串去除该权重最大候选词条的拼音子串中,将该拼音子串作为当前拼音串,从包括当前拼音串的最后拼音子串对应的所有候选词条的权重中,找出权重最大的候选词条,直到当前拼音串包括最开始的拼音子串为止,所得到的各个候选词条即为拼音串对应的各个候选词条,将这些候选词条的组合作为输入结果。
地址 100080 北京市海淀区北四环西路58号理想国际大厦1510层