发明名称 一种客户特征库生成方法和装置
摘要 本发明提供了一种客户特征库生成方法,通过计算不同聚类数k下的类内距离之和d,描绘出k-d值曲线;根据k-d值曲线找到其转折点,然后找到该转折点对应的k值,在该k值附近的范围内寻找最优聚类数kopt,将最优聚类数对应的聚类结果作为最终聚类结果。本发明还提供了一种客户特征库生成装置。本发明方案可以提高聚类搜索的效率及精度,根据本发明方法得到的客户特征库进行客户分析,可以提高营销活动的推荐成功率以及客户满意度。
申请公布号 CN102591872A 申请公布日期 2012.07.18
申请号 CN201110005454.4 申请日期 2011.01.06
申请人 中国移动通信集团四川有限公司 发明人 曾键;陈刚;梅松;张航友;程鹏;李玥毅
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 牛峥;王丽琴
主权项 1.一种客户特征库生成方法,其特征在于,包括如下步骤:A、输入包含n个移动客户的m个基本指标属性宽表,每个移动用户的m个基本指标构成一个m维向量;B、对于所有可能的聚类数k,对所述基本指标属性宽表中的向量进行聚类运算,并记录相应的类内距离之和<img file="FSA00000416181800011.GIF" wi="346" he="122" />的值以及聚类后的输出结果;a<sub>i</sub>∈A<sub>i</sub>,A<sub>i</sub>为聚类数k下的任一个聚类,a<sub>i</sub>为聚类A<sub>i</sub>的中心点,x为聚类A<sub>i</sub>所包含的样本;C、绘出k-d变化曲线,找到k-d变化曲线的转折点及处于该点的k值,记做k<sub>0</sub>;D、对k∈[k<sub>0</sub>-θ,k<sub>0</sub>+θ]范围内的所有k值,进行K-MEANS聚类算法运算,并算出相应k值下的聚类效果函数<img file="FSA00000416181800012.GIF" wi="688" he="271" />其中θ为整型常数;E、比较步骤D中得到的<img file="FSA00000416181800013.GIF" wi="186" he="63" />的值,取<img file="FSA00000416181800014.GIF" wi="187" he="63" />最小时的k值为最佳聚类数k<sub>opt</sub>;F、将步骤B中k=k<sub>opt</sub>时的聚类结果作为最终结果输出到客户特征库中。
地址 610041 四川省成都市高新区高鹏大道10号