发明名称 |
一种面向大规模异构数据的联合聚类方法 |
摘要 |
本发明公开了一种面向大规模异构数据的联合聚类方法。包括以下步骤:从异构数据中抽取实体以及实体间的异质关系,得到异质关系矩阵;从将异质关系矩阵对应的两个实体中选择规模小的实体X<sub>2</sub>,以实体X<sub>2</sub>的关联关系构建关联矩阵;采用对称矩阵稀疏分解法对关联矩阵C进行分解,得到实体X<sub>2</sub>对应的聚类指示矩阵B;将矩阵B作为输入,对异质关系矩R进行三分解,得到实体X<sub>1</sub>对应的聚类指示矩阵,通过实体X<sub>1</sub>对应的聚类指示矩阵和实体X<sub>2</sub>对应的聚类指示矩阵,实现实体类别划分。本发明能够降低矩阵的稀疏性,提高了联合聚类方法的准确率。 |
申请公布号 |
CN104636454A |
申请公布日期 |
2015.05.20 |
申请号 |
CN201510054469.8 |
申请日期 |
2015.02.02 |
申请人 |
哈尔滨工程大学 |
发明人 |
杨武;申国伟;王巍;苘大鹏;玄世昌 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种面向大规模异构数据的联合聚类方法,其特征在于:包括以下步骤,步骤一:从异构数据中抽取实体以及实体间的异质关系,建立二部图,得到异质关系矩阵R;步骤二:从将异质关系矩阵R对应的两个实体中选择规模小的实体X<sub>2</sub>,以实体X<sub>2</sub>的关联关系构建关联矩阵C;步骤三:采用对称矩阵稀疏分解法对关联矩阵C进行分解,得到实体X<sub>2</sub>对应的聚类指示矩阵B;步骤四:将实体X<sub>2</sub>对应的聚类指标矩阵B作为输入,对异质关系矩阵R进行三分解,得到实体X<sub>1</sub>对应的聚类指示矩阵F,通过实体X<sub>1</sub>对应的聚类指示矩阵F和实体X<sub>2</sub>对应的聚类指示矩阵B,实现实体类别划分。 |
地址 |
150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室 |