发明名称 | 关联规则数据挖掘所用的采样方法 | ||
摘要 | 本发明涉及一种数据挖掘技术,用于在众多的N种事务之内确定关联规则,每种事务包括多至p个不同的项目。依据本发明,在众多的N种事务中,根据精度需求确定一个样本规模n。选择样本规模n时,使它至少处于一个估计样本规模n*的量级上。最后,在众多的N种事务中,根据样本规模为n的一个样本,按照关联规则挖掘所用的任何整套方法,使用关联规则作为众多的N种事务的估计关联规则,计算关联规则。 | ||
申请公布号 | CN1578955A | 申请公布日期 | 2005.02.09 |
申请号 | CN02817246.9 | 申请日期 | 2002.07.26 |
申请人 | 国际商业机器公司 | 发明人 | 弗兰克·比克曼;罗兰·格伦德;安德里亚斯·鲁道夫 |
分类号 | G06F17/30;G06F17/18 | 主分类号 | G06F17/30 |
代理机构 | 中国国际贸易促进委员会专利商标事务所 | 代理人 | 付建军 |
主权项 | 1.一种计算机化的数据挖掘方法,用于在众多的N种事务之内确定关联规则,每种事务包括多至p个不同的项目,所述方法包括一个第一步骤,确定所述众多的N种事务的一个样本规模n其中所述样本规模n是根据精度需求而确定,以及其中所述样本规模n是根据达到所述精度需求之多变量估计分析而确定,以及所述方法包括一个第二步骤,按照挖掘关联规则所用的任何整套方法,根据所述众多的N种事务中样本规模为n的一个样本,计算关联规则,使用所述关联规则作为所述众多的N种事务的估计关联规则。 | ||
地址 | 美国纽约 |