发明名称 通过确定输入数据中的模式进行数据挖掘
摘要 通过以下方式执行包含多个事务(每个事务具有至少一个项目)的输入数据中的模式检测。接收用于感兴趣模式的过滤器条件,并确定与生成候选模式有关的第一适用过滤器条件集合。选择已评估的候选模式作为父候选模式并维护有关所述父候选模式的评估信息。通过扩展所述父候选模式并考虑第一过滤器条件集合来生成子候选模式。相对于共同在多个类似候选模式集合内的输入数据并根据有关所述父候选模式的所述评估信息来评估所述子候选模式。递归地使用至少一个成功通过评估步骤的子候选模式作为父候选模式。
申请公布号 CN101401100B 申请公布日期 2012.10.10
申请号 CN200780008938.6 申请日期 2007.02.02
申请人 国际商业机器公司 发明人 A·多奈希;T·博林格;C·林根费尔德
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市中咨律师事务所 11247 代理人 于静;杨晓光
主权项 一种用于检测包含多个事务的输入数据中的模式的计算机化方法,每个事务具有至少一个项目,所述方法包括以下步骤:接收用于感兴趣模式的过滤器条件,根据所接收的过滤器条件,确定与生成候选模式有关的第一适用过滤器条件集合,选择已评估的候选模式作为父候选模式并维护有关所述父候选模式的评估信息,所述评估信息包括指示输入数据中的事务或事务组是否为父候选模式的支持度作出贡献的布尔值,通过扩展所述父候选模式并通过应用第一适用过滤器条件集合来生成子候选模式,相对于共同在多个类似候选模式集合内的输入数据并根据有关所述父候选模式的所述评估信息来评估所述子候选模式,每个类似候选模式集合具有最多预定数量的类似候选模式并且至少一个类似候选模式集合具有至少两个类似候选模式,每一个类似候选模式集合中的类似候选模式由于添加到父候选模式的一个不同项目而彼此不同,以及递归地使用至少一个成功通过评估步骤的子候选模式作为父候选模式。
地址 美国纽约