发明名称 一种基于关系模式学本体的数据集成系统的构建方法
摘要 本发明提供一种基于关系模式学本体的数据集成系统的构建方法,是一种把通过关系模式学到的本体信息运用到数据集成中的方法。该方法是采用本体和XML技术的异构数据集成构建方法,即利用本体在语义上的优势和XML在语法上的表达能力来实现一种异构数据集成的方法。通过从局部数据源的关系模式中学并构建针对局部数据源的局部本体和针对领域的全局本体,以及建立映射关系来消除数据的异构性。对外提供统一查询接口,通过所建立的映射关系把全局查询分解为对局部数据源的子查询,经过对各个子查询的优化后将查询结果合并返回。本发明解决了异构的数据源之间交流时产生的语法语义异构问题。
申请公布号 CN102542027A 申请公布日期 2012.07.04
申请号 CN201110435781.3 申请日期 2011.12.22
申请人 北京航空航天大学深圳研究院 发明人 李超;高鹏;吕志强;李蕊
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京科迪生专利代理有限责任公司 11251 代理人 李新华;成金玉
主权项 一种基于关系模式学习本体的数据集成系统的构建方法,所述的构建方法包括通过关系模式学习本体信息构建、查询处理构建以及系统的整体架构构建三大部分;所述的系统的整体架构包括接口层,中间件层和数据源层三层;所述的接口层用来与外界进行交互;所述的中间件层负责系统核心查询业务,查询过程中使用本体库及本体映射规则;所述的数据源层包括局部数据源以及数据源上构建的局部本体库;所述的本体的构建过程包括局部本体的构建,全局本体的构建,以及全局本体和局部本体之间、局部本体和局部数据源之间的映射关系;所述的映射关系包括:本体概念映射,本体属性映射以及本体关系映射;其特征在于:其中,所述的通过关系模式学习本体信息构建,是指对局部数据源的关系模式分析分别对本体的概念、属性和约束等信息进行构建:1)如果对于关系R有唯一主键,可以创建一个对应的本体概念;2)如果两个关系Ri和Rj有相同主键且Ri中的每一个主键值都在Rj中,则Ri对应的概念是Rj对应概念的子概念;3)如果两个关系的主键值完全相同,则它们对应的概念为同一概念;4)如果关系Ri的外键对应于Rj的一个属性,则创建一个从Ri对应概念到Rj对应概念的对象属性;5)如果一个关系Rk的主键分别是Ri和Rj主键的并集,且Ri和Rj主键的交集为空,则创建一个从Ri对应概念到Rj对应概念的可逆对象属性;6)对于一个关系模式R的属性A,都可以创建一个对应的本体属性P,如果A既不是主键也不是外键,P是一个值属性;7)如果A是主键或外键,则P的基数约束是1;如果A被声明是NOTNULL的,那么P的最小基数约束是1;如果A被声明是Unique的,那么P的最大基数约束是2;8)如果A的取值是枚举给定的,那么P要映射为一个枚举属性;如果A的取值范围是一定的,那么P要映射为一个数据范围;如果A是一个外键,那么P有一个allValuesFrom约束;所述的查询处理构建包括如下的学习步骤:1)通过外界交互查询针对领域内全局本体的全局查询请求数据;2)通过分析所生成的全局查询以及全局本体与局部本体,局部本体和局部数据源之间 的映射关系,把全局查询请求数据分解为针对局部数据源的子查询请求;3)针对每一个分解的子查询请求,通过从查询语句中提取出不含变量路径的表达式和基于路径的谓词,将查询合并化简;4)通过对各个子查询的查询结果进行合并,使得查询的一些中间结果和最终结果可以被之后的查询所使用,并把最终结果返回。
地址 518057 广东省深圳市深圳市南山区高新技术南区虚拟大学园A501室