发明名称 一种基于DTBF的RFID冗余数据清洗方法及系统
摘要 本发明公开了一种基于DTBF的RFID冗余数据清洗方法。首先初始化DTBF;读取新数据x,计算元素x的k个哈希地址:如果向量BF<sub>i</sub>的k个哈希位置的时间值Tag.time全都不为0,当新元素的TID等于向量BF<sub>i</sub>的k个哈希位置的TID时,求取新元素x与向量BF<sub>r</sub>中k个哈希位置的时间域Tag.time中的时间差X,判断时间差X是否大于时间窗口ω,如果否,则表示新元素x为非冗余数据,并存储数据;如果是,则新元素x为冗余数据,直接丢弃数据。本发明提供的方法集成了Dynamic Bloom Filter能够处理动态数据集合的特性及Time Bloom Filter能够利用时间信息进行冗余判断的特点,该方法可动态调整DTBF包含的向量数,并且DTBF每个向量均为一个Time Bloom Filter,可以利用时间信息进行数据冗余的判断。
申请公布号 CN105938480A 申请公布日期 2016.09.14
申请号 CN201610212717.1 申请日期 2016.04.07
申请人 重庆大学 发明人 孙棣华;刘卫宁;赵敏;郑林江;王东方
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京汇泽知识产权代理有限公司 11228 代理人 武君
主权项 一种基于DTBF的RFID冗余数据清洗方法,其特征在于:包括以下步骤:步骤1:初始化DTBF;步骤2:读取新数据,计算新数据中的新元素x的k的哈希地址;步骤3:设置向量BF<sub>i</sub>(1≤i≤r),并逐个检查每个向量BF<sub>i</sub>(1≤i≤r)中新元素x对应的k个哈希地址是否都为0;如果向量BF<sub>i</sub>(1≤i≤r)中k个哈希位置不全都为0,则进入到步骤4;如果向量BF<sub>i</sub>的k个哈希位置的时间域Tag.time位全都不为0,则判断新元素的TID是否等于向量BF<sub>i</sub>的k个哈希位置的TID,如果等于,则进入到步骤5;如果不等于,则表示发生误判,输出报警信息;步骤4:检查向量BF<sub>r</sub>的是否达到存储容限,如果达到,则设置新向量BF<sub>r</sub>,并进行初始化向量BF<sub>r</sub>,将新元素x插入新向量BF<sub>r</sub>中;步骤5:求取新元素x与向量BF<sub>r</sub>中k个哈希位置的时间域Tag.time中的时间差X,判断时间差X是否大于时间窗口ω,如果否,则表示新元素x为非冗余数据,并存储数据;步骤6:如果是,则新元素x为冗余数据,直接丢弃数据。
地址 400044 重庆市沙坪坝区沙正街174号