发明名称 一种结构化数据分布式索引及检索方法
摘要 本发明公开了一种结构化数据分布式索引及检索方法,使用MapReduce程序构建分布式局部索引架构的倒排索引表,并将索引表存入分布式列数据库;在建立索引时,包括以下步骤:选定常用列;建立倒排索引;实现分布式索引;在进行检索时包括以下步骤:给定检索列名;构造检索关键字;用检索关键字在倒排索引中进行查找;查找结果返回的并集即为检索结果集。本发明使用MapReduce程序建立分布式局部索引架构的倒排索引表,解决了海量结构化数据检索效率低的问题,检索速率将得到极大的提升。
申请公布号 CN104268158A 申请公布日期 2015.01.07
申请号 CN201410447252.9 申请日期 2014.09.03
申请人 深圳大学 发明人 毛睿;陆敏华;李荣华;王毅;刘刚;岳磅;廖凯华
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市兴科达知识产权代理有限公司 44260 代理人 杜启刚
主权项 一种结构化数据分布式索引及检索方法,其特征在于,使用MapReduce程序构建分布式局部索引架构的倒排索引表,并将索引表存入分布式列数据库;在建立索引时,包括以下步骤:101)选定常用列;102)建立倒排索引;103)实现分布式索引;在进行检索时包括以下步骤:104)给定检索列名;105)构造检索关键字;106)用检索关键字在倒排索引中进行查找;107)查找结果返回的并集即为检索结果集。
地址 518000 广东省深圳市南山区南海大道3688号