发明名称 | 改进的拼写检查系统和方法 | ||
摘要 | 本发明利用搜索查询字符串的迭代变换以及从搜索查询日志和/或web数据提取出来的统计量,给搜索查询字符串提供可能的备选拼写。这提供一种能用来给每个用户提供个性化建议的拼写检查方法。通过利用搜索查询日志,本发明能考虑到辞典里没有但仍可接受为所关心的搜索查询的子串。这允许一种提供在辞典内容之外的质量更高的备选拼写建议的方法。本发明的一个实例通过利用从查询日志中提取出来的词一元模型和/或二元模型的统计量并结合迭代搜索,在子串级别上工作。这为给定查询提供了实质上比只利用子串匹配的方法更好的拼写备选方案。本发明的其他实例能接收来自除了搜索查询输入之外的来源的输入数据。 | ||
申请公布号 | CN1670723A | 申请公布日期 | 2005.09.21 |
申请号 | CN200510059231.0 | 申请日期 | 2005.03.16 |
申请人 | 微软公司 | 发明人 | E·D·布里尔;S·-P·库塞赞 |
分类号 | G06F17/27;G06F17/30 | 主分类号 | G06F17/27 |
代理机构 | 上海专利商标事务所有限公司 | 代理人 | 沈昭坤 |
主权项 | 1.一种促进拼写检查的系统,包括:一接收包含文本的输入数据的组件;以及一拼写检查组件,其识别文本中一组潜在地被错拼的子串,并基于至少一个查询日志,给所述子串组建议至少一个备选拼写;所述查询日志包括在一个时间范围内被诸用户用于查询数据集的数据。 | ||
地址 | 美国华盛顿州 |