发明名称 | 分布式支持向量聚类的方法及系统 | ||
摘要 | 本发明公开了一种分布式支持向量聚类的方法,包括:对输入的数据集按照预定处理规则进行处理,并对全局参数及任务进行初始化;向各个计算节点分发预定数据集或特定计算结果;当计算节点分到预定数据集,则初始化所述预定数据集的权重向量,并按照预定公式进行迭代运算,计算出所述预定数据集中每个样本的权重系数值;找到所述权重系数值大于预定极小值的样本作为支持向量,并将所述支持向量进行编号;利用所述支持向量以及各支持向量的权重系数,构建支持函数,进行簇划分,得到所述支持向量的簇标号,并标定非支持向量样本作为聚类分析的结果;该方法能够有效提高支持向量聚类的效率。 | ||
申请公布号 | CN104408206A | 申请公布日期 | 2015.03.11 |
申请号 | CN201410815788.1 | 申请日期 | 2014.12.23 |
申请人 | 许昌学院 | 发明人 | 平源;李慧娜;张志立;张永;杨月华;马慧 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京集佳知识产权代理有限公司 11227 | 代理人 | 罗满 |
主权项 | 一种分布式支持向量聚类的方法,其特征在于,包括:对输入的数据集按照预定处理规则进行处理,并对全局参数及任务进行初始化;向各个计算节点分发预定数据集或特定计算结果;当计算节点分到预定数据集,则初始化所述预定数据集的权重向量,并按照预定公式进行迭代运算,计算出所述预定数据集中每个样本的权重系数值;找到所述权重系数值大于预定极小值的样本作为支持向量,并将所述支持向量进行编号;利用所述支持向量以及各支持向量的权重系数,构建支持函数,进行簇划分,得到所述支持向量的簇标号,并标定非支持向量的簇标号,作为整个数据集的聚类分析的结果。 | ||
地址 | 450000 河南省许昌市魏都区八一路88号 |