发明名称 一种基于半监督聚类的迁移学方法
摘要 本发明提供的是一种基于半监督聚类的迁移学方法。包括计算目标数据与辅助数据各类中数据的相似度、平均相似度;由平均相似度得到目标数据与类标签的一个相似度权重向量,取向量中权重最大的为目标数据的标签;以目标数据为质心,进行K-均值聚类,聚类成簇,每簇中以簇中数据占所属类中总数据比例最大者的标签为簇标签;将再分类结果与预分类结果做对比;在最终形成的目标数据相似度权重向量中,挑选权重最大的数据标签作为目标数据数据标签,从而形成最终分类器。本发明提供一种将分类方法、技术从一个领域迁移到另一个领域的提高分类结果精确度的一种基于半监督聚类的迁移学方法。
申请公布号 CN103020122A 申请公布日期 2013.04.03
申请号 CN201210464867.3 申请日期 2012.11.16
申请人 哈尔滨工程大学 发明人 初妍;陈曼;沈洁;夏琳琳;王勇;李丽洁;高迪;王兴梅
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于半监督聚类的迁移学习方法,其特征在于包括以下步骤:(1)、计算目标数据与辅助数据各类中数据的相似度;(2)、计算目标数据与辅助数据各类的平均相似度;(3)、预分类:由平均相似度得到目标数据与类标签的一个相似度权重向量,取向量中权重最大的为目标数据的标签;(4)、再分类:以目标数据为质心,进行K‑均值聚类,聚类成簇,每簇中以簇中数据占所属类中总数据比例最大者的标签为簇标签;(5)、将再分类结果与预分类结果做对比,若两者相同,则增大相似度权重向量中类标签权重;若不相同,则减小类标签权重;(6)、在最终形成的目标数据相似度权重向量中,挑选权重最大的数据标签作为目标数据数据标签,从而形成最终分类器。
地址 150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室