发明名称 关联规则数据挖掘所用的采样方法
摘要 本发明涉及一种数据挖掘技术,用于在众多的N种事务之内确定关联规则,每种事务包括多至p个不同的项目。依据本发明,在众多的N种事务中,根据精度需求确定一个样本规模n。选择样本规模n时,使它至少处于一个估计样本规模n*的量级上。最后,在众多的N种事务中,根据样本规模为n的一个样本,按照关联规则挖掘所用的任何整套方法,使用关联规则作为众多的N种事务的估计关联规则,计算关联规则。
申请公布号 CN1578955A 申请公布日期 2005.02.09
申请号 CN02817246.9 申请日期 2002.07.26
申请人 国际商业机器公司 发明人 弗兰克·比克曼;罗兰·格伦德;安德里亚斯·鲁道夫
分类号 G06F17/30;G06F17/18 主分类号 G06F17/30
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 付建军
主权项 1.一种计算机化的数据挖掘方法,用于在众多的N种事务之内确定关联规则,每种事务包括多至p个不同的项目,所述方法包括一个第一步骤,确定所述众多的N种事务的一个样本规模n其中所述样本规模n是根据精度需求而确定,以及其中所述样本规模n是根据达到所述精度需求之多变量估计分析而确定,以及所述方法包括一个第二步骤,按照挖掘关联规则所用的任何整套方法,根据所述众多的N种事务中样本规模为n的一个样本,计算关联规则,使用所述关联规则作为所述众多的N种事务的估计关联规则。
地址 美国纽约