发明名称 一种基于聚类的多标签不平衡生物医学数据分类方法
摘要 本发明涉及一种基于聚类的多标签不平衡生物医学数据分类方法,包括以下步骤:S101对标签不均衡的数据根据特征相似度和标签关联性定义关系矩阵;S102根据关联矩阵对数据进行聚类;S103对每个类簇中的不平衡标签进行有方向性的增加;S104对每个类簇中的数据用多标签分类器进行训练学;S105根据投票原则把每个分类器的结果进行合并,预测出标签。本发明通过层次聚类方法对数据进行聚类,并且在聚类时考虑标签关联性来降低簇内标签的不平衡性,从而提高重采样方法生成新数据的可靠性,降低噪声数据的概率。
申请公布号 CN106599913A 申请公布日期 2017.04.26
申请号 CN201611115834.2 申请日期 2016.12.07
申请人 重庆邮电大学 发明人 王进;卜亚楠;欧阳卫华;谢水宁;孙开伟;张登峰;王科;李智星;陈乔松;邓欣;胡峰;雷大江
分类号 G06K9/62(2006.01)I;G06F19/00(2011.01)I 主分类号 G06K9/62(2006.01)I
代理机构 北京同恒源知识产权代理有限公司 11275 代理人 廖曦
主权项 一种基于聚类的多标签不平衡生物医学数据分类方法,其特征在于:包括以下步骤:S101对标签不均衡的数据根据特征相似度和标签关联性定义关联矩阵;S102根据关联矩阵对数据进行聚类;S103对每个类簇中的不平衡标签进行有方向性的增加;S104对每个类簇中的数据用多标签分类器进行训练学习;S105根据投票原则把每个分类器的结果进行合并,预测出标签。
地址 400065 重庆市南岸区黄桷垭崇文路2号