发明名称 |
一种基于聚类和投票机制的主动学初始样本选择方法 |
摘要 |
本发明公开了一种基于聚类和投票机制的主动学初始样本选择方法,具体步骤为:步骤一:输入整个数据集;步骤二:对数据集进行聚类得到多个簇;步骤三:用高斯混合模型对每个簇进行建模;步骤四:对每个簇,划定多个代表性区域;步骤五:对样本进行投票;步骤六:步骤一~步骤五重复进行多次;步骤七:根据投票结果选取初始训练样本。本发明具有良好的稳定性,本发明提出的方法能更好地提高主动学算法的性能,且是对这方面研究的一个很好的补充。 |
申请公布号 |
CN103336842A |
申请公布日期 |
2013.10.02 |
申请号 |
CN201310300591.X |
申请日期 |
2013.07.17 |
申请人 |
山东师范大学 |
发明人 |
冷严;徐新艳;齐广慧 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
济南圣达知识产权代理有限公司 37221 |
代理人 |
张勇 |
主权项 |
一种基于聚类和投票机制的主动学习初始样本选择方法,其特征是,具体步骤为:步骤一:输入整个数据集:对数据集中每个样本提取特征,用提取的特征表示样本,所有的样本组成整个数据集;步骤二:对整个数据集进行聚类得到多个簇;步骤三:利用高斯混合模型对每个簇分别建模;步骤四:利用高斯混合模型中的高斯混合分量对每个簇分别划定多个代表性区域;步骤五:对每个簇中的每个样本,如果其位于相应的代表性区域中,则为其投上一票,否则不为其投票;步骤六:多次重复步骤一至步骤五;步骤七:得票最多的样本被选做初始训练样本,生成初始训练样本集。 |
地址 |
250014 山东省济南市历下区文化东路88号 |