发明名称 一种面向RFID物流应用的松散性异构数据交换系统及方法
摘要 本发明公开了一种面向RFID物流应用的松散性异构数据交换系统,包括:数据适配模块和数据模式匹配模块。本发明还公开了一种面向RFID物流应用的松散性异构数据交换方法,包括以下步骤:S1.读取源数据;S2.若要进行关系模式匹配,数据适配模块将源数据类型转换为通用数据类型,并发至数据模式匹配模块;若否,转至S5;S3.数据模式匹配模块对数据做关系模式匹配;S4、若要做数据类型转换,数据模式匹配模块把处理后的数据发至数据适配模块;若否,转至S6;S5、数据适配模块将当前数据类型转换为目标数据类型;S6.异构数据交换过程结束。本发明具有耦合性低、扩展性好、转换方式灵活、接入方式快捷低廉和准确性高等优点。
申请公布号 CN101930464B 申请公布日期 2012.08.08
申请号 CN201010263019.7 申请日期 2010.08.25
申请人 华南理工大学 发明人 邓辉舫;李科定;胡春燕;刘靖;栗粟;陈宝云;林福娟
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州市华学知识产权代理有限公司 44245 代理人 李卫东
主权项 1.一种面向RFID物流应用的松散性异构数据交换系统,其特征在于,包括相互连接的数据适配模块和数据模式匹配模块,其中:数据适配模块,用于读取源数据,把不需要进行关系模式匹配的数据直接转换为用目标数据类型表示的数据;或把需要进行关系模式匹配的数据转换为用通用数据类型表示的数据,并发送到数据模式匹配模块进行处理,把数据模式匹配模块处理后的数据转换为用目标数据类型表示的数据;数据模式匹配模块,用于接收数据适配模块发送的数据,并对数据进行关系模式匹配,所述数据模式匹配模块包括:关系模式树存储模块,用于以通用数据类型预先存储目标关系模式树;数据字典,用于保存目标关系模式树上每一个标签的近义词;匹配度计算模块,用于根据数据字典,计算源关系模式树与目标关系模式树的匹配度,并对匹配的各表字段建立映射关系;所述匹配度计算模块计算匹配度的方式为:步骤S3.1、计算源关系模式树与目标关系模式树字段结点的匹配度,进入步骤3.2;步骤S3.2、计算源关系模式树与目标关系模式树各表结点的匹配度,进入步骤3.3;步骤S3.3、计算源关系模式树与目标关系模式树根结点的匹配度,进入步骤3.4;步骤S3.4、若源关系模式树与目标关系模式树根结点的匹配度大于或等于预设的阀值,则判断它们所对应的关系模式是匹配的,对匹配的各表的字段建立映射关系,将源数据导入到与其相配匹的目标数据域中;若两个关系模式树根结点的匹配度小于预设的阀值,则提示两个关系数据模式不匹配,不进行数据的交换;所述匹配度的计算步骤具体包括:设N<sub>s</sub>表示要进行匹配的源结点,N<sub>t</sub>表示要进行匹配的目标结点,其中所述N<sub>s</sub>、N<sub>t</sub>同为字段结点、表结点或数据库的根结点;步骤a、计算结点分别在标签维、属性维、深度维和结构维的匹配度:计算结点N<sub>s</sub>和N<sub>t</sub>在标签维上的匹配度QoM<sub>L</sub>:比较他们的标签是否相同,若相同则匹配度为1;若不相同,则以N<sub>t</sub>的标签为索引去数据字典中查找N<sub>s</sub>的标 签,若找到,则说明两个结点在标签维上匹配,QoM<sub>L</sub>为1;若找不到则说明两个结点在标签维没有相关性,QoM<sub>L</sub>为0;计算结点N<sub>s</sub>和N<sub>t</sub>在属性维上的匹配度QoM<sub>P</sub>:由于把属性全都当成是字符串处理,所以在属性维上两结点的匹配度都是1;计算结点N<sub>s</sub>和N<sub>t</sub>在深度维上的匹配度QoM<sub>H</sub>:如果待比较的结点在关系模式树中的深度相同,则匹配度为1;若不相同,则为0;计算结点N<sub>s</sub>和N<sub>t</sub>在结构维的匹配度QoM<sub>S</sub>:对于叶子结点,它们没有子结构,其在结构维的匹配度为1;对于非叶子结点,其在结构维的匹配度决定于“平均匹配度”和“配成比率”;结点的平均匹配度通过下式计算:<img file="FSB00000792021400021.GIF" wi="636" he="138" />其中N<sub>s</sub>和N<sub>t</sub>分别表示要进行匹配的源结点和目标结点,n<sub>s</sub>是N<sub>s</sub>的子结点,它与N<sub>t</sub>的子结点n<sub>t</sub>的匹配度最大,且两子结点的匹配度大于预设的阀值,|N<sub>t</sub>|则表示目标结点中子结点的数目,结点的平均匹配度的取值范围是[0,1];结点的配成比率通过下式计算:<img file="FSB00000792021400022.GIF" wi="379" he="153" /><img file="FSB00000792021400023.GIF" wi="76" he="76" />表示目标结点的子结点匹配的个数,|N<sub>t</sub>|则表示目标结点中子结点的数目,结点的配成比率的取值范围是[0,1];两个结点在结构维上的匹配度为:<img file="FSB00000792021400024.GIF" wi="898" he="108" />两结点在结构维上的匹配度的取值范围是[0,1];步骤b、根据步骤a的计算结果,计算两个结点的匹配度:QoM(N<sub>s</sub>,N<sub>t</sub>)=W<sub>L</sub>*QoM<sub>L</sub>+W<sub>P</sub>*QoM<sub>P</sub>+W<sub>S</sub>*QoM<sub>S</sub>+W<sub>H</sub>*QoM<sub>H</sub>其中QoM<sub>L</sub>表示要进行匹配的两个结点N<sub>s</sub>和N<sub>t</sub>在标签维上的匹配度,QoM<sub>P</sub>表示要进行匹配的两个结点N<sub>s</sub>和N<sub>t</sub>在属性维的匹配度,QoM<sub>S</sub>表示要进行匹配的两个结点N<sub>s</sub>和N<sub>t</sub>在结构维的匹配度,QoM<sub>H</sub>表示要进行匹配的两个结点N<sub>s</sub>和N<sub>t</sub>在深度维的匹配度,它们的取值范围均为[0,1];W<sub>L</sub>表示在计算两结点匹配度公 式中标签维度上所占的权重,W<sub>P</sub>表示在计算两结点匹配度公式中属性维度上所占的权重,W<sub>S</sub>表示在计算两结点匹配度公式中结构维度上所占的权重,W<sub>H</sub>分别表示在计算两结点匹配度公式中深度维度上所占的权重,所述W<sub>L</sub>、W<sub>P</sub>、W<sub>S</sub>、W<sub>H</sub>是预先设置的,W<sub>L</sub>、W<sub>P</sub>、W<sub>S</sub>、W<sub>H</sub>的取值范围均为[0,1],且W<sub>L</sub>、W<sub>P</sub>、W<sub>S</sub>、W<sub>H</sub>的和为1;数据导入模块,用于依据映射关系,在源关系模式树中,将与目标关系模式树相匹配的字段的值保留下来,将该字段值导入到与目标关系模式树相应的字段中;所述匹配度计算模块分别与关系模式树存储模块、数据字典和数据导入模块相连。
地址 510640 广东省广州市天河区五山路381号