发明名称 |
一种生成纠错数据库的方法、自动纠错的方法和系统 |
摘要 |
本发明提供了一种生成纠错数据库的方法和装置以及一种自动纠错的方法和系统。所述生成纠错数据库的方法可以包括以下步骤:收集日志信息,所述日志信息包括用户的输入历史记录;利用所述输入历史记录的序列信息,从所述日志信息中挖掘获取字符纠错关系;存储所述字符纠错关系,得到纠错数据库。本发明通过记录和收集包括有用户输入过程信息的日志,从中将用户手动纠错的信息挖掘出来,生成纠错数据库,以用于实现对更多用户更准确的自动纠错,还可以用于实现对该用户的个性化自动纠错。由于本发明所应用的纠错信息是从包括有用户输入过程信息的日志中得到的,相对于计算机的分析查错而言,本发明更符合用户需求,更为准确。 |
申请公布号 |
CN101241514A |
申请公布日期 |
2008.08.13 |
申请号 |
CN200810102471.8 |
申请日期 |
2008.03.21 |
申请人 |
北京搜狗科技发展有限公司 |
发明人 |
苏雪峰 |
分类号 |
G06F17/30(2006.01) |
主分类号 |
G06F17/30(2006.01) |
代理机构 |
北京集佳知识产权代理有限公司 |
代理人 |
苏培华;逯长明 |
主权项 |
1、一种生成纠错数据库的方法,其特征在于,包括:收集日志信息,所述日志信息包括用户的输入历史记录;利用所述输入历史记录的序列信息,从所述日志信息中挖掘获取字符纠错关系;存储所述字符纠错关系,得到纠错数据库。 |
地址 |
100084北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |