发明名称 |
一种并行主题挖掘方法及装置 |
摘要 |
本发明实施例提供一种并行主题挖掘方法及装置。该方法包括:并行主题挖掘装置中的第一节点接收第二节点发送的第二单词-主题子矩阵和第二余数子矩阵;其中,第二余数子矩阵包括余数矩阵中行累加值最大的行以及列累加值最大的列,所述第二单词-主题子矩阵包括所述余数矩阵中行累加值最大的行的行号在单词-主题矩阵中对应的行,以及所述余数矩阵中列累加值最大的列的列号在所述单词-主题矩阵中对应的列;并根据第二单词-主题子矩阵更新第一单词-主题子矩阵,根据第二余数子矩阵更新第一余数子矩阵,将更新后的第一单词-主题子矩阵和第一余数子矩阵发送至第二节点。从而减小主题挖掘过程中的通讯量,提高主题挖掘的速度。 |
申请公布号 |
CN104866491A |
申请公布日期 |
2015.08.26 |
申请号 |
CN201410062523.9 |
申请日期 |
2014.02.24 |
申请人 |
华为技术有限公司 |
发明人 |
曾嘉;倪冰;陈嘉 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同立钧成知识产权代理有限公司 11205 |
代理人 |
刘芳 |
主权项 |
一种并行主题挖掘方法,其特征在于,包括:并行主题挖掘装置中的第一节点接收所述并行主题挖掘装置中的第二节点发送的第二单词‑主题子矩阵和第二余数子矩阵;其中,所述第二余数子矩阵包括余数矩阵中行累加值最大的行以及列累加值最大的列,所述第二单词‑主题子矩阵包括所述余数矩阵中行累加值最大的行的行号在单词‑主题矩阵中对应的行,以及所述余数矩阵中列累加值最大的列的列号在所述单词‑主题矩阵中对应的列;所述第一节点根据所述第二单词‑主题子矩阵更新第一单词‑主题子矩阵,根据所述第二余数子矩阵更新第一余数子矩阵,并将更新后的第一单词‑主题子矩阵和更新后的第一余数子矩阵发送至所述第二节点。 |
地址 |
518129 广东省深圳市龙岗区坂田华为总部办公楼 |