发明名称 一种面向时间序列数据的增量模糊c中心点聚类方法
摘要 本发明提出了一种面向时间序列数据的增量模糊c中心点聚类方法,该方法采用了改进的时间动态规整距离,同时与模糊c中心点技术和多通道增量方法相结合。使用该方法后,可以处理大规模时间序列数据集和时间序列数据数据流,加快处理速度,同时提高对时间序列数据的聚类精度。
申请公布号 CN106529595A 申请公布日期 2017.03.22
申请号 CN201610996734.9 申请日期 2016.11.11
申请人 河南理工大学 发明人 刘永利;武帅;郭倩倩;刘静;韩秀娟
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 代理人
主权项 一种面向时间序列数据的增量模糊c中心点聚类方法,其特征在于:该方法包括以下步骤:(1)将整个数据集进行分块处理,并为每块数据中的每个数据点分配权重1;(2)初始化中心点,从数据块中找到一个数据点,使得此数据点到整个数据块中其他数据点的距离之和最小,之后在数据块中的其他数据点找到另一个数据点,与第一个数据点的距离最大,作为第二个中心点,然后在数据块中的其他数据点找到一个数据点,与已找到的中心点距离之和最大,以此类推,直到找到所有的中心点;(3)对每个数据块进行聚类处理,聚类过程中,快速动态时间弯曲距离采用动态规划方法,通过拉伸或压缩一部分时间序列数据匹配两个时间序列数据,(4)当中心点不再变化时停止迭代;(5)迭代结束后得到聚类结果[U<sub>11</sub>,U<sub>12</sub>,...,U<sub>1t</sub>,...,U<sub>1c</sub>]和聚类中心点[v<sub>11</sub>,v<sub>12</sub>,...,v<sub>1t</sub>,...,v<sub>1c</sub>];(6)给从数据集中刚获取的新数据块中每个数据点赋予权重w<sub>k</sub>=1,然后依次进行步骤(2)~(5)的操作;(7)对每一个数据块执行步骤(6),直到所有数据块处理完毕,获取每一数据块的聚类结果[U<sub>i1</sub>,U<sub>i2</sub>,...,U<sub>it</sub>,...,U<sub>ic</sub>]和聚类中心点[v<sub>i1</sub>,v<sub>i2</sub>,...,v<sub>it</sub>,...,v<sub>ic</sub>];为每一个中心点v<sub>it</sub>赋予权重值w<sub>t</sub>,w<sub>t</sub>为整个数据块中的数据点隶属于聚类U<sub>it</sub>的隶属度之和;将这些赋过权重的中心点作为一个新的数据块m,对新数据块依次进行步骤(2)~(5)的操作,得到聚类结果[U<sub>1</sub>,U<sub>2</sub>,...,U<sub>t</sub>,...,U<sub>c</sub>]和中心点[v<sub>1</sub>,v<sub>2</sub>,...,v<sub>t</sub>,...,v<sub>c</sub>],此中心点即为最终的中心点,每个中心点原来所在类中的所有数据点都属于它现在所在的类;若最后一个数据块小于聚类个数c,则不进行聚类,直接将所有数据点作为中心点,其权重全部为1。
地址 454003 河南省焦作市高新区世纪大道2001号河南理工大学计算机学院