发明名称 |
一种修正用户词库的方法和系统 |
摘要 |
本发明提供了一种修正用户词库的方法和系统,所述方法包括:检查当前输入内容是否与用户已完成输入内容的全部或者其一部分,在输入编码上相同或相近,而文字不同;和/或,检查当前输入内容是否与用户已完成输入内容的全部或者其一部分,文字相同而输入编码不同;如果满足条件,则基于当前输入内容和纠错内容,对用户词库中的数据进行修正;所述纠错内容为已完成输入内容中与当前输入内容相对应的部分。本发明可以更智能的记录用户输入信息,尽可能的避免对错误输入进行学词,减少在用户词库中的数据噪音。本发明不需要对用户编辑行为做更多限定,大大拓展了词库修正的应用广度和深度,可以更好的去除一些现有技术无法发现的数据噪音。 |
申请公布号 |
CN103049458B |
申请公布日期 |
2016.06.08 |
申请号 |
CN201110314509.X |
申请日期 |
2011.10.17 |
申请人 |
北京搜狗科技发展有限公司 |
发明人 |
张扬;王坚 |
分类号 |
G06F17/30(2006.01)I;G06F3/023(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
苏培华 |
主权项 |
一种修正用户词库的方法,其特征在于,适用于输入编码不可再编辑的场合,包括:检查当前输入内容是否与用户已完成输入内容的全部或者其一部分,在输入编码上相同或相近,而文字不同;和/或,检查当前输入内容是否与用户已完成输入内容的全部或者其一部分,文字相同而输入编码不同;如果满足条件,则基于当前输入内容和纠错内容,对用户词库中的数据进行修正;所述纠错内容为已完成输入且不能编辑的内容中与当前输入内容相对应的部分。 |
地址 |
100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |