发明名称 |
基于从集群生成的模型来预测输入数据的结果 |
摘要 |
一种基于模型来预测输入数据的结果的方法,所述模型是基于相关字的集群、相关片段的集群和训练数据而被生成的。该方法包括接收含特定语言的多个词的数据集。在该特定语言中,词是由字构成的。相关字的集群是从数据集生成的。模型是至少基于相关字的集群和训练数据而被生成的。该模型还可以基于相关片段的集群。训练数据包括多个条目,其中每个条目包括字和该字的指定结果。包括尚未与指定结果相关联的字的一组输入数据被接收。该模型被应用于输入数据以确定输入数据内的字的预测结果。 |
申请公布号 |
CN101460941A |
申请公布日期 |
2009.06.17 |
申请号 |
CN200780020357.4 |
申请日期 |
2007.05.30 |
申请人 |
雅虎公司 |
发明人 |
彭富春 |
分类号 |
G06F15/18(2006.01)I;G06F17/00(2006.01)I |
主分类号 |
G06F15/18(2006.01)I |
代理机构 |
北京东方亿思知识产权代理有限责任公司 |
代理人 |
宋 鹤;南 霆 |
主权项 |
1. 一种包括执行涉及指令的由机器执行的操作的方法,其中所述由机器执行的操作是以下操作中的至少一个:A)通过传输介质发送所述指令;B)通过传输介质接收所述指令;C)将所述指令存储到机器可读存储介质上;以及D)执行所述指令;其中,所述指令是当被一个或多个处理器执行时使所述一个或多个处理器执行以下步骤的指令:接收包括特定语言的多个词的数据集,其中,在所述特定语言中,词是由字构成的;从所述数据集生成相关字的集群;至少基于以下各项来生成模型:所述相关字的集群;以及包括多个条目的训练数据,其中每个条目包括字和该字的指定结果;接收一组输入数据,其中,所述输入数据包括尚未与指定结果相关联的字,以及将所述模型应用于所述输入数据以确定所述输入数据内的字的预测结果。 |
地址 |
美国加利福尼亚州 |