发明名称 |
一种字词输入的纠错方法及系统 |
摘要 |
本发明公开了一种字词输入的纠错方法及系统,其中,所述方法包括:检测用户输入的编码字符串中存在的错误输入片段;纠正所述编码字符串中的错误输入片段,生成至少一个纠错候选字符串;利用基于编码字符串的噪音信道模型,对所述纠错候选字符串进行评估;根据评估的结果,将至少一个所述纠错候选字符串转换为输入文字,并展现所述输入文字。通过本发明,能够提高纠错的有效性或命中率。 |
申请公布号 |
CN102156551B |
申请公布日期 |
2014.04.23 |
申请号 |
CN201110079202.6 |
申请日期 |
2011.03.30 |
申请人 |
北京搜狗科技发展有限公司 |
发明人 |
张扬 |
分类号 |
G06F3/023(2006.01)I |
主分类号 |
G06F3/023(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
逯长明;王宝筠 |
主权项 |
一种字词输入的纠错方法,其特征在于,包括: 检测用户输入的编码字符串中存在的错误输入片段; 纠正所述编码字符串中的错误输入片段,生成至少一个纠错候选字符串; 利用基于编码字符串的噪音信道模型,对所述纠错候选字符串进行评估; 根据评估的结果,将至少一个所述纠错候选字符串转换为输入文字,并展现所述输入文字; 其中,所述基于编码字符串的噪音信道模型包括基于编码字符串的语言模型和/或基于编码字符串的纠错模型; 所述基于编码字符串的语言模型用于描述编码字符串中前后连接的各个元素之间通顺的概率; 所述基于编码字符串的纠错模型用于描述编码字符串中上下文位置关系确定的情况下,出现各种可能的输入错误的概率。 |
地址 |
100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |