发明名称 大规模语义数据路径查询的方法
摘要 本发明涉及基于MapReduce编程框架地图的路径搜索技术领域,公开了一种大规模语义数据路径查询的方法,本发明通过基于MapReduce的编程框架,采用流行的图的路径查询排序的算法,完成大规模语义数据的关系路径的查询。本发明有效地实现了语义数据关系路径在数量级很大的情况下,路径查询也能很快进行,从返回结果上,不仅告诉用户,位于路径两端的两个本体是什么,更关键的是关心了具体这两个本体是怎么连接起来的,让用户清晰的看到这条链上的所有有关联的本体。
申请公布号 CN102129457A 申请公布日期 2011.07.20
申请号 CN201110056579.X 申请日期 2011.03.09
申请人 浙江大学 发明人 吴朝晖;陈华钧;梁欣颖
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州裕阳专利事务所(普通合伙) 33221 代理人 应圣义
主权项 大规模语义数据路径查询的方法,其特征在于,包括下列步骤:步骤A:需要定制查询路径的模式:a:查询路径的语法:查询路径表达式为基于本体的属性而非字符的正则表达式,该路径表达式基本能够满足查询需求;b:路径评估:路径按照难易程度分为以下两种:简单路径:路径表达式只包含连接(sequence)、取反(reverse)和{n},即路径长度固定;复杂路径:路径表达式中包含*, ,{},即该路径的长度可变;步骤B:分析路径表达式,将路径表达式进行拆分:所述的简单路径需要将路径表达式分成几个更简单的表达式,然后将其join(求交),连接起来,过程中需要迭代,如果其中间结果不满足路径条件,不作为最终结果;所述的复杂路径需要迭代,输出相应的结果;步骤C:MapReduce工作步骤:c:准备工作:将原路径表达式和分析好的路径表达式链记录;d:MapReduce的Mapper读入数据,其中以语义数据三元组中的Object(宾语)和Subject(主语)作为<key,value>中的key,以其关联关系的属性链及宾语作为value,分发数据;e:Reducer接收数据后,根据拆分好的路径,对数据进行join操作,得到根据路径连接起来的本体链;f:重复步骤d和e,直到不会在产生新的根据路径连接起来的本体链,有区别的是在迭代的过程中,要将拆分好的路径链按照最初的路径表达式再一步步连接起来,恢复成原来的路径或与之等价的路径;g:根据路径,输出结果。
地址 310027 浙江省杭州市西湖区浙大路38号浙大计算机学院曹光彪东楼505