发明名称 一种面向大规模异构数据的联合聚类方法
摘要 本发明公开了一种面向大规模异构数据的联合聚类方法。包括以下步骤:从异构数据中抽取实体以及实体间的异质关系,得到异质关系矩阵;从将异质关系矩阵对应的两个实体中选择规模小的实体X<sub>2</sub>,以实体X<sub>2</sub>的关联关系构建关联矩阵;采用对称矩阵稀疏分解法对关联矩阵C进行分解,得到实体X<sub>2</sub>对应的聚类指示矩阵B;将矩阵B作为输入,对异质关系矩R进行三分解,得到实体X<sub>1</sub>对应的聚类指示矩阵,通过实体X<sub>1</sub>对应的聚类指示矩阵和实体X<sub>2</sub>对应的聚类指示矩阵,实现实体类别划分。本发明能够降低矩阵的稀疏性,提高了联合聚类方法的准确率。
申请公布号 CN104636454A 申请公布日期 2015.05.20
申请号 CN201510054469.8 申请日期 2015.02.02
申请人 哈尔滨工程大学 发明人 杨武;申国伟;王巍;苘大鹏;玄世昌
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种面向大规模异构数据的联合聚类方法,其特征在于:包括以下步骤,步骤一:从异构数据中抽取实体以及实体间的异质关系,建立二部图,得到异质关系矩阵R;步骤二:从将异质关系矩阵R对应的两个实体中选择规模小的实体X<sub>2</sub>,以实体X<sub>2</sub>的关联关系构建关联矩阵C;步骤三:采用对称矩阵稀疏分解法对关联矩阵C进行分解,得到实体X<sub>2</sub>对应的聚类指示矩阵B;步骤四:将实体X<sub>2</sub>对应的聚类指标矩阵B作为输入,对异质关系矩阵R进行三分解,得到实体X<sub>1</sub>对应的聚类指示矩阵F,通过实体X<sub>1</sub>对应的聚类指示矩阵F和实体X<sub>2</sub>对应的聚类指示矩阵B,实现实体类别划分。
地址 150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室