发明名称 |
一种基于Map/Reduce的快速支持向量数据描述方法及系统 |
摘要 |
本发明涉及一种基于Map/Reduce的快速支持向量数据描述方法及系统,其中方法包括:对用于支持向量数据描述的数据进行预处理,生成支持向量数据描述的训练数据集D;根据预设置的参数、由训练数据集D生成n个子数据集,预设置的参数包括训练数据集的划分个数;根据n个子数据集,生成MapReduce编程架构下的n个子分类器SVDDi=(1,......,n)的Map任务,并将Map任务交由Hadoop集群调度器进行运算;调用MapReduce编程架构下的Reduce任务进行子分类器SVDDi=(1,......,n)的合并,得到训练数据集的SVDD分类器。本发明可以在处理海量数据时,降低SVDD训练数据集的维数,加快SVDD训练速度,同时避免训练中断。 |
申请公布号 |
CN102591940A |
申请公布日期 |
2012.07.18 |
申请号 |
CN201110443726.9 |
申请日期 |
2011.12.27 |
申请人 |
厦门市美亚柏科信息股份有限公司 |
发明人 |
庄进发;吴鸿伟;罗佳 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京恒都律师事务所 11395 |
代理人 |
何自刚 |
主权项 |
一种基于Map/Reduce的快速支持向量数据描述方法,其特征在于,包括以下步骤:对用于支持向量数据描述的数据进行预处理,生成支持向量数据描述的训练数据集D;根据预设置的参数、由所述训练数据集D生成n个子数据集,所述预设置的参数包括训练数据集的划分个数;根据所述n个子数据集,生成Map/Reduce编程架构下的n个子分类器SVDDi=(1,......,n)的Map任务,并将所述Map任务交由Hadoop集群调度器进行运算;在所述Hadoop集群调度器运算完成后,调用Map/Reduce编程架构下的Reduce任务进行子分类器SVDDi=(1,......,n)的合并,得到最后训练数据集的SVDD分类器;其中,所述i、n为自然数。 |
地址 |
361008 福建省厦门市软件园二期观日路12号美亚柏科大厦 |