发明名称 |
一种快速发现效用模式的数据挖掘方法 |
摘要 |
本发明“一种快速发现效用模式的数据挖掘方法”能从海量数据中发现既具有显著统计特征又符合用户期望与目标的效用模式,在网络信息搜索与知识发现中有广泛应用前景。针对现有方法采用生成候选模式的两阶段法、造成时间与空间开销瓶颈的问题,本发明提出了三项创新技术。一是基于稀疏矩阵和虚拟投影的数据表示,二是前缀生长策略与前缀生长树及其剪裁方法,三是深度优先的动态搜索法,从而设计出单阶段、不生成候选模式、挖掘效用模式的全新挖掘方法。本发明挖掘方法的时间效率比三个参照挖掘方法高1至3个数量级,并且内存使用量少40%到90%。本发明挖掘方法所具有的高性能使得海量Web挖掘、多媒体挖掘、文本挖掘等各种应用成为可能。 |
申请公布号 |
CN102662948A |
申请公布日期 |
2012.09.12 |
申请号 |
CN201210042570.8 |
申请日期 |
2012.02.23 |
申请人 |
浙江工商大学 |
发明人 |
刘君强;蒋晓宁;甘志刚;余斌霄 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种快速发现效用模式的数据挖掘方法,根据事务数据库D、效用信息表UT、效用阀值minutil,以最少存貯空间和最快速度找出效用值不低于minutil的模式,包括以下三项核心技术的具体方法流程:A基于稀疏矩阵和虚拟投影的数据表示。B前缀生长策略与前缀生长树及其剪裁方法。C深度优先的动态搜索法。 |
地址 |
310018 浙江省杭州市下沙高教园区学正街18号 |