发明名称 |
一种基于云存储的电力全文检索方法及系统 |
摘要 |
本发明公开了一种基于云存储的电力全文检索方法,包括:获取查询信息,确定查询信息的特征向量;根据查询信息的特征向量获取特征向量相似度大于预设相似度阈值的文档,将获取到的文档存储于临时数据库中,所述临时数据库设置在云存储系统中;根据预设的电力主题词表的分词词库对临时数据库中各个文档进行分词处理,将得到的分词结果按照倒排结构进行存储,得到索引数据库,所述索引数据库也设置在云存储系统中;获取用户的搜索信息,从索引数据库中查找得到与所述搜索信息关联性最大的预设数量个文档,将所述文档返回给用户所在的客户端。本发明还提供一种基于云存储的电力全文检索系统,能够实现对于电力关键词的全文检索,且提高了检索效率。 |
申请公布号 |
CN102156711A |
申请公布日期 |
2011.08.17 |
申请号 |
CN201110054382.2 |
申请日期 |
2011.03.08 |
申请人 |
国网信息通信有限公司;北京天云融创科技有限公司;北京友友天宇系统技术有限公司 |
发明人 |
曹汝滨;吴凯峰;张荣;孙雪芬;徐杰锋;肖政;方东煦;李云;吴铧明 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
逯长明;王宝筠 |
主权项 |
一种基于云存储的电力全文检索方法,其特征在于,包括:获取查询信息,确定查询信息的特征向量;根据查询信息的特征向量获取特征向量相似度大于预设相似度阈值的文档,将获取到的文档存储于临时数据库中,所述临时数据库设置在云存储系统中;根据预设的电力主题词表的分词词库对临时数据库中各个文档进行分词处理,将得到的分词结果按照倒排结构进行存储,得到索引数据库,所述索引数据库也设置在云存储系统中;获取用户的搜索信息,从索引数据库中查找得到与所述搜索信息关联性最大的预设数量个文档,将所述文档返回给用户所在的客户端。 |
地址 |
100761 北京市宣武区白广路二条一号 |