发明名称 |
构建用于基于知识的匹配的特征和索引 |
摘要 |
此处公开了用于生成包含在知识库中的文档的增强的索引的系统和方法。将文档或配置快照令牌化,然后将它们传递通过多个过滤器。过滤器通过从令牌流中移除单词,并将域级别知识添加到令牌流中的各令牌中来修改该流以生成文档的增强的令牌流。然后,将令牌流添加到文档的索引中,以便当从配置快照或从输入的搜索查询生成搜索时,可以完成相对于知识库的搜索。 |
申请公布号 |
CN105814563A |
申请公布日期 |
2016.07.27 |
申请号 |
CN201480068039.5 |
申请日期 |
2014.12.09 |
申请人 |
微软技术许可有限责任公司 |
发明人 |
N·贾殷;L·胡;L·张;R·波塔居;V·弗洛什;M·王;J·K·W·陈 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
罗婷婷 |
主权项 |
一种用于索引文档的系统,包括:被配置成预处理文档以创建经预处理的文档的预处理组件;被配置成处理所述经预处理的文档以生成令牌流的分析器,所述令牌流包括所述文档的多个令牌,其中所述令牌流包括至少一个经修改的令牌;被配置成将所述令牌流添加到所述文档中并生成所述文档的索引的索引器;以及被配置成存储所述文档的所述索引的知识库数据库。 |
地址 |
美国华盛顿州 |