发明名称 | 一种信息检索方法及其系统 | ||
摘要 | 本申请公开了一种信息检索方法及其系统,应用于每个文档对应有正排索引数据的信息检索系统,以解决现有信息检索技术中检索效率低的问题。该方法包括:接收查询词,通过分词处理得到该查询词中所包含的关键词;通过所述信息检索系统的倒排索引数据查找与所述关键词匹配的文档,以及与所述文档对应的正排索引数据;根据所述文档对应的正排索引数据确定出所述文档的摘要,将所述文档的摘要以及文档的信息作为检索结果进行输出。采用本申请,可提高信息检索的效率,同时在一定程度上保证检索的准确性。 | ||
申请公布号 | CN102023989A | 申请公布日期 | 2011.04.20 |
申请号 | CN200910174208.4 | 申请日期 | 2009.09.23 |
申请人 | 阿里巴巴集团控股有限公司 | 发明人 | 罗翼 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京同达信恒知识产权代理有限公司 11291 | 代理人 | 郭润湘 |
主权项 | 一种信息检索方法,应用于每个文档对应有正排索引数据的信息检索系统,其中,每个文档的正排索引数据以该文档中的各单词为索引,记录各单词在该文档中的位置,其特征在于,该方法包括以下步骤:接收查询词,通过分词处理得到该查询词中所包含的关键词;通过所述信息检索系统的倒排索引数据查找与所述关键词匹配的文档,以及与所述文档对应的正排索引数据;根据所述文档对应的正排索引数据确定出所述文档的摘要,将所述文档的摘要以及文档的信息作为检索结果进行输出。 | ||
地址 | 英属开曼群岛大开曼岛 |