一种面向时间序列数据的增量模糊c中心点聚类方法,申请号CN201610996734.9-传众专利搜索

发明名称	一种面向时间序列数据的增量模糊c中心点聚类方法
摘要	本发明提出了一种面向时间序列数据的增量模糊c中心点聚类方法，该方法采用了改进的时间动态规整距离，同时与模糊c中心点技术和多通道增量方法相结合。使用该方法后，可以处理大规模时间序列数据集和时间序列数据数据流，加快处理速度，同时提高对时间序列数据的聚类精度。
申请公布号	CN106529595A	申请公布日期	2017.03.22
申请号	CN201610996734.9	申请日期	2016.11.11
申请人	河南理工大学	发明人	刘永利;武帅;郭倩倩;刘静;韩秀娟
分类号	G06K9/62(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构		代理人
主权项	一种面向时间序列数据的增量模糊c中心点聚类方法，其特征在于：该方法包括以下步骤：(1)将整个数据集进行分块处理，并为每块数据中的每个数据点分配权重1；(2)初始化中心点，从数据块中找到一个数据点，使得此数据点到整个数据块中其他数据点的距离之和最小，之后在数据块中的其他数据点找到另一个数据点，与第一个数据点的距离最大，作为第二个中心点，然后在数据块中的其他数据点找到一个数据点，与已找到的中心点距离之和最大，以此类推，直到找到所有的中心点；(3)对每个数据块进行聚类处理，聚类过程中，快速动态时间弯曲距离采用动态规划方法，通过拉伸或压缩一部分时间序列数据匹配两个时间序列数据，(4)当中心点不再变化时停止迭代；(5)迭代结束后得到聚类结果[U<sub>11</sub>,U<sub>12</sub>,...,U<sub>1t</sub>,...,U<sub>1c</sub>]和聚类中心点[v<sub>11</sub>,v<sub>12</sub>,...,v<sub>1t</sub>,...,v<sub>1c</sub>]；(6)给从数据集中刚获取的新数据块中每个数据点赋予权重w<sub>k</sub>＝1，然后依次进行步骤(2)～(5)的操作；(7)对每一个数据块执行步骤(6)，直到所有数据块处理完毕，获取每一数据块的聚类结果[U<sub>i1</sub>,U<sub>i2</sub>,...,U<sub>it</sub>,...,U<sub>ic</sub>]和聚类中心点[v<sub>i1</sub>,v<sub>i2</sub>,...,v<sub>it</sub>,...,v<sub>ic</sub>]；为每一个中心点v<sub>it</sub>赋予权重值w<sub>t</sub>，w<sub>t</sub>为整个数据块中的数据点隶属于聚类U<sub>it</sub>的隶属度之和；将这些赋过权重的中心点作为一个新的数据块m,对新数据块依次进行步骤(2)～(5)的操作，得到聚类结果[U<sub>1</sub>,U<sub>2</sub>,...,U<sub>t</sub>,...,U<sub>c</sub>]和中心点[v<sub>1</sub>,v<sub>2</sub>,...,v<sub>t</sub>,...,v<sub>c</sub>]，此中心点即为最终的中心点，每个中心点原来所在类中的所有数据点都属于它现在所在的类；若最后一个数据块小于聚类个数c，则不进行聚类，直接将所有数据点作为中心点，其权重全部为1。
地址	454003 河南省焦作市高新区世纪大道2001号河南理工大学计算机学院