发明名称 RDF数据分布式语义并行推理方法
摘要 本发明涉及一种RDF数据分布式语义并行推理方法,首先依据本体文件和RDFS/OWL规则,构建传递闭包关系矩阵(Transitive closure relation matrix,简称TRM)和连接变量信息,进而生成规则标记;然后根据连接变量的类型对RDFS/OWL规则进行分类,分别设计不同的推理方案,结合MapReduce计算框架并行地完成RDFS/OWL规则的推理。通过连接变量信息和规则标记对实例三元组进行过滤,能够减少大量无用的三元组数据在分布式系统中的传输损耗。通过构造传递闭包矩阵能够减少推理的迭代次数,提高推理的效率。最后,根据推理结果,实时地删除重复的三元组数据,以进一步提高后续迭代推理的效率。通过本发明在数据量增大的情况下能够高效且正确的实现RDFS/OWL规则的推理。
申请公布号 CN105912721A 申请公布日期 2016.08.31
申请号 CN201610293055.5 申请日期 2016.05.05
申请人 福州大学 发明人 汪璟玢;叶怡新;郑春
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 福州元创专利商标代理有限公司 35100 代理人 蔡学俊
主权项 一种RDF数据分布式语义并行推理方法,其特征在于:具体包括以下步骤:步骤S1:加载模式三元组,构建TRM,同时根据RDFS/OWL规则,构建每条规则中可能连接的连接变量信息;步骤S2:根据TRM和连接变量信息,生成规则标记模型;步骤S3:将连接变量分成单变量和多变量两种形式,根据TRM和连接变量的类型,将RDFS/OWL规则分成5种类型,分别设计不同的推理方案;步骤S4:对Flag_Rule<sub>m</sub>=1的规则执行RDFS/OWL规则的并行推理,并输出中间结果;步骤S5:删除中间结果中的重复三元组;步骤S6:如果中间结果中包含新的SchemaTriple,则更新TRM和规则标记模型,返回步骤S4;否则,结束。
地址 350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区