发明名称 |
一种基于聚类的多标签不平衡生物医学数据分类方法 |
摘要 |
本发明涉及一种基于聚类的多标签不平衡生物医学数据分类方法,包括以下步骤:S101对标签不均衡的数据根据特征相似度和标签关联性定义关系矩阵;S102根据关联矩阵对数据进行聚类;S103对每个类簇中的不平衡标签进行有方向性的增加;S104对每个类簇中的数据用多标签分类器进行训练学;S105根据投票原则把每个分类器的结果进行合并,预测出标签。本发明通过层次聚类方法对数据进行聚类,并且在聚类时考虑标签关联性来降低簇内标签的不平衡性,从而提高重采样方法生成新数据的可靠性,降低噪声数据的概率。 |
申请公布号 |
CN106599913A |
申请公布日期 |
2017.04.26 |
申请号 |
CN201611115834.2 |
申请日期 |
2016.12.07 |
申请人 |
重庆邮电大学 |
发明人 |
王进;卜亚楠;欧阳卫华;谢水宁;孙开伟;张登峰;王科;李智星;陈乔松;邓欣;胡峰;雷大江 |
分类号 |
G06K9/62(2006.01)I;G06F19/00(2011.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
北京同恒源知识产权代理有限公司 11275 |
代理人 |
廖曦 |
主权项 |
一种基于聚类的多标签不平衡生物医学数据分类方法,其特征在于:包括以下步骤:S101对标签不均衡的数据根据特征相似度和标签关联性定义关联矩阵;S102根据关联矩阵对数据进行聚类;S103对每个类簇中的不平衡标签进行有方向性的增加;S104对每个类簇中的数据用多标签分类器进行训练学习;S105根据投票原则把每个分类器的结果进行合并,预测出标签。 |
地址 |
400065 重庆市南岸区黄桷垭崇文路2号 |