发明名称 |
一种划分客户群集的计算机实现的方法和系统 |
摘要 |
本发明涉及对数据库的数据分析,尤其涉及对商业数据库进行数据挖掘。公开一种用于划分客户群集的计算机实现的方法和系统。该方法包含:接收一个原始客户记录集合,其中,客户记录集合中的每个客户记录代表一个客户,每个客户记录包含至少一个数据属性,每个数据属性有一个属性值;对原始客户记录集合进行预处理,以生成预处理后的客户记录集合;对预处理后的客户记录集合执行一个聚类算法,将预处理后的客户记录集合划分成预定个数的群集。其中,所述预处理包含:确定原始客户记录集合中的每个客户记录所代表的客户的类型;在相应的客户记录中用一个类型属性表示该客户的类型;对数据属性和类型属性的值进行归一化;对数据属性的值和类型属性的值分别加权,获得数据属性的加权属性值和类型属性的加权属性值。 |
申请公布号 |
CN102737327B |
申请公布日期 |
2016.02.10 |
申请号 |
CN201110080939.X |
申请日期 |
2011.03.31 |
申请人 |
国际商业机器公司 |
发明人 |
张斌;谢明;尹文君;董进;杰奎琳.G.莫里斯;曹恒 |
分类号 |
G06Q30/02(2012.01)I;G06F17/30(2006.01)I |
主分类号 |
G06Q30/02(2012.01)I |
代理机构 |
北京市柳沈律师事务所 11105 |
代理人 |
黄小临 |
主权项 |
一种用于划分客户群集的计算机实现的方法,包含:接收一个原始客户记录集合,其中,客户记录集合中的每个客户记录代表一个客户,每个客户记录包含至少一个数据属性,每个数据属性有一个属性值;对原始客户记录集合进行预处理,以生成预处理后的客户记录集合;对预处理后的客户记录集合执行一个聚类算法,将预处理后的客户记录集合划分成预定个数的群集,其中,所述预处理包含:确定原始客户记录集合中的每个客户记录所代表的客户的类型;在相应的客户记录中用一个类型属性表示该客户的类型;对数据属性和类型属性的值进行归一化;对数据属性的值和类型属性的值分别加权,获得数据属性的加权属性值和类型属性的加权属性值,其中,所述对数据属性的值和类型属性的值分别加权,包含用散度权重因子α对数据属性的属性值加权,用纯度权重因子β,对类型属性的属性值加权,其中α+β=1,其中,可调节散度权重因子和纯度权重因子,以影响对预处理后的客户记录集合执行该聚类算法而产生的预定个数的群集的纯度,其中,一个群集的纯度,是该群集中的具有特定的类型属性的客户记录占该群集中的总客户记录数的比率。 |
地址 |
美国纽约阿芒克 |