发明名称 |
一种处理交易事务数据库数据的方法和装置 |
摘要 |
本发明提供处理交易事务数据库数据的方法和装置,以提高关联规则数据挖掘的运算效率。所述方法包括:将交易事务数据库的数据分成N份以获得N个分块事务数据库,按照每个计算节点一个分块事务数据库的方式分发至N个并行处理的计算节点;每个计算节点将各自分得的分块事务数据库转化为压缩的事务布尔矩阵;N个并行处理的计算节点通过对压缩的事务布尔矩阵的行向量或列向量进行相“与”计算得到所有k-频繁项集。本发明提供的技术方案一方面减少了扫描交易数据库的次数,从而提高了读取交易事务数据库的效率;另一方面,省去现有Apriori算法的连接和裁剪,通过对压缩的事务布尔矩阵的行和列向量的裁剪,提高了k-频繁项集的计算效率。 |
申请公布号 |
CN105354336A |
申请公布日期 |
2016.02.24 |
申请号 |
CN201510894914.1 |
申请日期 |
2015.12.07 |
申请人 |
TCL集团股份有限公司 |
发明人 |
冯研 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳中一专利商标事务所 44237 |
代理人 |
张全文 |
主权项 |
一种处理交易事务数据库数据的方法,其特征在于,所述方法包括:将交易事务数据库的数据分成N份以获得N个分块事务数据库,并按照每个计算节点一个分块事务数据库的方式分发至N个并行处理的计算节点,所述N为大于1的自然数;所述每个计算节点将各自分得的分块事务数据库转化为压缩的事务布尔矩阵;所述N个并行处理的计算节点通过对所述压缩的事务布尔矩阵的行向量或列向量进行相“与”计算,得到所有k‑频繁项集,所述k为自然数。 |
地址 |
516006 广东省惠州市仲恺高新技术开发区十九号小区 |