发明名称 分布式支持向量聚类的方法及系统
摘要 本发明公开了一种分布式支持向量聚类的方法,包括:对输入的数据集按照预定处理规则进行处理,并对全局参数及任务进行初始化;向各个计算节点分发预定数据集或特定计算结果;当计算节点分到预定数据集,则初始化所述预定数据集的权重向量,并按照预定公式进行迭代运算,计算出所述预定数据集中每个样本的权重系数值;找到所述权重系数值大于预定极小值的样本作为支持向量,并将所述支持向量进行编号;利用所述支持向量以及各支持向量的权重系数,构建支持函数,进行簇划分,得到所述支持向量的簇标号,并标定非支持向量样本作为聚类分析的结果;该方法能够有效提高支持向量聚类的效率。
申请公布号 CN104408206A 申请公布日期 2015.03.11
申请号 CN201410815788.1 申请日期 2014.12.23
申请人 许昌学院 发明人 平源;李慧娜;张志立;张永;杨月华;马慧
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 罗满
主权项 一种分布式支持向量聚类的方法,其特征在于,包括:对输入的数据集按照预定处理规则进行处理,并对全局参数及任务进行初始化;向各个计算节点分发预定数据集或特定计算结果;当计算节点分到预定数据集,则初始化所述预定数据集的权重向量,并按照预定公式进行迭代运算,计算出所述预定数据集中每个样本的权重系数值;找到所述权重系数值大于预定极小值的样本作为支持向量,并将所述支持向量进行编号;利用所述支持向量以及各支持向量的权重系数,构建支持函数,进行簇划分,得到所述支持向量的簇标号,并标定非支持向量的簇标号,作为整个数据集的聚类分析的结果。
地址 450000 河南省许昌市魏都区八一路88号