主权项 |
一种面向时间序列数据的增量模糊c中心点聚类方法,其特征在于:该方法包括以下步骤:(1)将整个数据集进行分块处理,并为每块数据中的每个数据点分配权重1;(2)初始化中心点,从数据块中找到一个数据点,使得此数据点到整个数据块中其他数据点的距离之和最小,之后在数据块中的其他数据点找到另一个数据点,与第一个数据点的距离最大,作为第二个中心点,然后在数据块中的其他数据点找到一个数据点,与已找到的中心点距离之和最大,以此类推,直到找到所有的中心点;(3)对每个数据块进行聚类处理,聚类过程中,快速动态时间弯曲距离采用动态规划方法,通过拉伸或压缩一部分时间序列数据匹配两个时间序列数据,(4)当中心点不再变化时停止迭代;(5)迭代结束后得到聚类结果[U<sub>11</sub>,U<sub>12</sub>,...,U<sub>1t</sub>,...,U<sub>1c</sub>]和聚类中心点[v<sub>11</sub>,v<sub>12</sub>,...,v<sub>1t</sub>,...,v<sub>1c</sub>];(6)给从数据集中刚获取的新数据块中每个数据点赋予权重w<sub>k</sub>=1,然后依次进行步骤(2)~(5)的操作;(7)对每一个数据块执行步骤(6),直到所有数据块处理完毕,获取每一数据块的聚类结果[U<sub>i1</sub>,U<sub>i2</sub>,...,U<sub>it</sub>,...,U<sub>ic</sub>]和聚类中心点[v<sub>i1</sub>,v<sub>i2</sub>,...,v<sub>it</sub>,...,v<sub>ic</sub>];为每一个中心点v<sub>it</sub>赋予权重值w<sub>t</sub>,w<sub>t</sub>为整个数据块中的数据点隶属于聚类U<sub>it</sub>的隶属度之和;将这些赋过权重的中心点作为一个新的数据块m,对新数据块依次进行步骤(2)~(5)的操作,得到聚类结果[U<sub>1</sub>,U<sub>2</sub>,...,U<sub>t</sub>,...,U<sub>c</sub>]和中心点[v<sub>1</sub>,v<sub>2</sub>,...,v<sub>t</sub>,...,v<sub>c</sub>],此中心点即为最终的中心点,每个中心点原来所在类中的所有数据点都属于它现在所在的类;若最后一个数据块小于聚类个数c,则不进行聚类,直接将所有数据点作为中心点,其权重全部为1。 |