发明名称 一种基于粒子群算法的多标签分类方法
摘要 本发明提供了一种基于粒子群算法的多标签分类方法包括优化阶段和分类阶段。优化阶段是采用粒子群算法优化特征加权KNN算法的特征权值;分类阶段是将优化阶段得出的特征权值应用到特征加权KNN算法中给测试样本X进行分类,最终输出测试集中所有样本的标签,即分类完成。本发明能够找到最优的特征权值来消除数据集中的特征(计算距离时是指属性值)的冗余或是不相关,从而减少了距离偏差,提高了分类的准确度。
申请公布号 CN104991974A 申请公布日期 2015.10.21
申请号 CN201510464344.2 申请日期 2015.07.31
申请人 中国地质大学(武汉) 发明人 梁庆中;樊媛媛;姚宏;颜雪松;胡成玉;曾德泽;刘超
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京国智京通知识产权代理有限公司 11501 代理人 张瑜
主权项 一种基于粒子群算法的多标签分类方法,其特征在于,包括优化阶段和分类阶段:S10:优化阶段是采用粒子群算法优化特征加权KNN算法的特征权值,具体包括如下步骤:S11:采用随机方法初始化粒子群,每个粒子的位置和速度的维度为n,每个粒子的位置对应数据集中一条记录的特征权值向量w=(w<sub>1</sub>,w<sub>2</sub>,···,w<sub>n</sub>):其中有<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>w</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>;</mo></mrow>]]></math><img file="FDA0000772311380000011.GIF" wi="228" he="138" /></maths>S12:计算适应值,进而求出局部最优解和全局最优解:在计算适应值时,将粒子的位置即特征权值应用到特征加权KNN算法中,将原训练样本集中前70%当做新的训练样本,后30%当做新的预测样本集,对此预测样本集进行分类,算出分类的准确度,准确度越高越符合适应值;预测样本集每条记录的原始标签为li=(li1,li2,···,lin),分类过后的预测标签为lj=(lj1,lj2,···,ljn),li与l<sub>j</sub>与重合个数为sum,那么准确率Accruay=sum/n;S20:分类阶段:将优化阶段得出的特征权值应用到特征加权KNN算法中给测试样本X进行分类,最终输出测试集中所有样本的标签,完成分类。
地址 430070 湖北省武汉市洪山区鲁磨路388号