主权项 |
1.一种客户特征库生成方法,其特征在于,包括如下步骤:A、输入包含n个移动客户的m个基本指标属性宽表,每个移动用户的m个基本指标构成一个m维向量;B、对于所有可能的聚类数k,对所述基本指标属性宽表中的向量进行聚类运算,并记录相应的类内距离之和<img file="FSA00000416181800011.GIF" wi="346" he="122" />的值以及聚类后的输出结果;a<sub>i</sub>∈A<sub>i</sub>,A<sub>i</sub>为聚类数k下的任一个聚类,a<sub>i</sub>为聚类A<sub>i</sub>的中心点,x为聚类A<sub>i</sub>所包含的样本;C、绘出k-d变化曲线,找到k-d变化曲线的转折点及处于该点的k值,记做k<sub>0</sub>;D、对k∈[k<sub>0</sub>-θ,k<sub>0</sub>+θ]范围内的所有k值,进行K-MEANS聚类算法运算,并算出相应k值下的聚类效果函数<img file="FSA00000416181800012.GIF" wi="688" he="271" />其中θ为整型常数;E、比较步骤D中得到的<img file="FSA00000416181800013.GIF" wi="186" he="63" />的值,取<img file="FSA00000416181800014.GIF" wi="187" he="63" />最小时的k值为最佳聚类数k<sub>opt</sub>;F、将步骤B中k=k<sub>opt</sub>时的聚类结果作为最终结果输出到客户特征库中。 |