发明名称 一种基于SVM的大数据分类预测方法
摘要 本发明提供了一种基于SVM的大数据分类预测方法,可以进行大数据样本的有效信息择决操作,获取一种新型决定因素,从而找到一个能够体现原始大数据信息的新型样本C,对于样本C进行SVM分类预测操作,结果表明分类正确率大大的提高,大大的缩短运行时间,是大数据信息处理的一种有效方式。
申请公布号 CN103902706B 申请公布日期 2017.05.03
申请号 CN201410127325.6 申请日期 2014.03.31
申请人 东华大学 发明人 安俊峰;龚涛;卢萌萌;郭吉政
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海申汇专利代理有限公司 31001 代理人 翁若莹
主权项 一种基于SVM的大数据分类预测方法,针对一组具有n个决定因素,记为N<sub>1</sub>,N<sub>2</sub>,...,N<sub>n</sub>,样本容量为M的大数据,该大数据共分为p类,第1类样本记为样本M<sub>11</sub>,M<sub>12</sub>,M<sub>13</sub>,...,第2类样本记为样本M<sub>21</sub>,M<sub>22</sub>,M<sub>23</sub>,...,……,第p类样本记为样本M<sub>p1</sub>,M<sub>p2</sub>,M<sub>p3</sub>,...,其特征在于,步骤为:步骤1、对M个样本进行主成分分析操作,得到贡献率达到某个固定值的个数X;步骤2、用层次分析法得到每个决定因素的权值T<sub>1</sub>,T<sub>2</sub>,...,T<sub>n</sub>,按照从大到小的顺序取前X个权值;步骤3、计算得到每类样本中各个样本数据所对应的新型决定因素,将属于同一类样本的所有新型决定因素由小到大排序,取得排列在中间的B%的数据,形成新的样本集C,B的值根据样本容量自行设定,样本容量越大,B越小,取得的有效数据越具有统计价值,其中,第i类样本中第j个样本数据M<sub>ij</sub>对应的新型决定因素w<sub>ij</sub>的计算过程为:设样本数据M<sub>ij</sub>与N<sub>1</sub>,N<sub>2</sub>,...,N<sub>n</sub>相对应的内容为A<sub>ij1</sub>,A<sub>ij2</sub>,...,A<sub>ijn</sub>,在T<sub>1</sub>,T<sub>2</sub>,...,T<sub>n</sub>及A<sub>ij1</sub>,A<sub>ij2</sub>,...,A<sub>ijn</sub>中取前X个值,则<img file="FDA0001174628980000011.GIF" wi="341" he="131" />步骤4、在样本集C中选取一定量的数据作为训练样本,一定量的数据进行预测分析,对样本集C进行基于SVM的样本分类预测。
地址 201620 上海市松江区人民北路2999号