发明名称 |
基于海量数据的图查询处理方法 |
摘要 |
本发明提供了一种基于海量数据的图查询处理方法,带来一系列有益的技术效果,如在面对海量的图数据,无论是在庞大的数据规模上,或是数据的内部结构和关系的多样和复杂上,都能有效的进行处理,可以在查询研究工作中很好的解决top-k问题,也能够直接的求解top-k的子图匹配。 |
申请公布号 |
CN104699698A |
申请公布日期 |
2015.06.10 |
申请号 |
CN201310654842.4 |
申请日期 |
2013.12.05 |
申请人 |
深圳先进技术研究院 |
发明人 |
陈春;成杰峰;张慧玲 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市科进知识产权代理事务所(普通合伙) 44316 |
代理人 |
沈祖锋;郝明琴 |
主权项 |
一种基于海量数据的图查询处理方法,其特征在于,包括以下步骤:S1、定义路径长度S,遍历不同节点的出发路径,记录长度不大于所述路径长度S的路径,并重复通过Map、Reduce方法获得多个连接表;S2、采用所述多个连接表构建一个多重排序匹配列表,并对该排序匹配列表进行全部查询,找到最接近的K个匹配来多维表示;S3、采用所述多维表示建立一个图模型;S4、根据所述图模型来定义一个查询区域,并计算所述排序匹配列表中序列的大小;S5:定义查询图Q,并根据该查询图Q获得其任意生成树;S6:根据所述排序匹配列表中序列的大小生成按从大到小顺序排列的查询树,得排好序的查询树匹配列表;S7:对每条查询树缺失的边进行最短路径计算;S8:通过所述查询树缺失的边的最短路径寻找对应的查询图Q;S9:所述查询图Q采用评分函数计算出其权重,以得到查询图Q的top‑k解。 |
地址 |
518055 广东省深圳市南山区西丽大学城学苑大道1068号 |