主权项 |
一种基于云服务平台大数据挖掘的仓位组合方法,其特征在于,具体包括如下步骤:将历史订单数据作为数据源,通过关联规则计算出商品之间的关联性,采用分布处理思想,首先求解频繁k‐1项集,然后自联接生成候选频繁k项集;频繁k项集的求解如下:a)将商品作为主键建立商品Id表;b)根据表中的数据求解频繁项集,假定最小支持数为s,求出交易项对应的交易Id数组中元素的个数就求出了改交易项的支持数;求出交易项对应的交易Id数组中的元素个数得出该交易项的支出数;如果交易项不是频繁的则从商品Id表中删除,所述的频繁的具体为:如果交易项对应的交易Id数组长度大于支持数s,则交易项是频繁的,否则不是频繁的;定义一个数组IDArray,存储数据库汇总交易项和其交易Id,数组的长度为交易Id的总个数,把该数组的各个元素的初始值设为0,这个数组称为ID数组,ID数组只有1个。从生成的所有频繁k‑1项集的第1个频繁项集开始;把该频繁项集对应的所有交易ID在数组中对应的元素设置为1,扫描所有其后面的频繁k‑1项集和它进行自连接;如果和某个频繁k‑1项集m生成了一个候选频繁k项集p,则累计m包含的交易ID在数组中的对应位置的值为1的个数n;如果n大于最小支持数则为频繁的,否则是非频繁的;如果生成的这个项集p为频繁的,则把p加入到商品Id表中;当扫描完某个频繁k‑1项集后面的所有频繁k‑1项集后,则以后的求解过程和该频繁k‑1项集无关,把该频繁k‑1项集的条目从商品Id表中删除;循环一直到不再生成候选频繁k项集结束,最后输出所有的频繁项集。新生成的商品Id表中的交易项即是商品关联项,根据表中的交易项组合仓位;根据新得到的商品Id表计算交易Id的频率,将交易项按照交易Id顺序进行排列,即仓位访问频率,将访问频率高的仓位组合设置在离仓库出口最近的地方。 |