发明名称 一种海量数字信息的分布式推荐方法
摘要 本发明公开了一种海量数字信息的分布式推荐方法,包括以下步骤:S1:建设对等的分布式局域网络,该分布式局域网络中至少包括20台计算机,两个计算机之间均可以进行相互通讯;S2:在对等分布式局域网络中部署Hadoop集群;S3:收集当前用户有关系的数字信息的集合,该数字信息的集合通过Hadoop的Map和Reduce两个阶段并行统计与当前用户有关系的数字信息,当前用户有关系的数字信息作为Map阶段的信息输入数据源,Reduce阶段的信息输入数据源为Map阶段的输出结果。本发明的分布式推荐方法在海量数字信息的情况下向用户推荐数字信息的速度更快,且海量数字信息的分布式推荐方法向用户推荐的数字信息更加准确。
申请公布号 CN106547919A 申请公布日期 2017.03.29
申请号 CN201611110429.1 申请日期 2016.12.06
申请人 广东工业大学;东莞华南设计创新院 发明人 王勇;王瑛
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市智圈知识产权代理事务所(普通合伙) 44351 代理人 韩绍君
主权项 一种海量数字信息的分布式推荐方法,其特征在于,包括以下步骤:S1:建设对等的分布式局域网络,该分布式局域网络中至少包括20台计算机,两个计算机之间均可以进行相互通讯;S2:在对等分布式局域网络中部署Hadoop集群;S3:收集当前用户有关系的数字信息的集合,该数字信息的集合通过Hadoop的Map和Reduce两个阶段并行统计与当前用户有关系的数字信息,当前用户有关系的数字信息作为Map阶段的信息输入数据源,Reduce阶段的信息输入数据源为Map阶段的输出结果;S4:运行并行的Map阶段运算,且Map阶段运算的输入数据源为步骤S3中的Reduce阶段输出结果,进而来构建数字信息之间的相似度矩阵;S5:将步骤S4得到的相似度矩阵按照相关程度,可以将相似度矩阵划分为相似度完全一致的相似度矩阵、相似度较大的相似度矩阵和相似度较小的相似度矩阵;S6:根据步骤S5得到的相似度完全一致的相似度矩阵,直接提取该相似度矩阵中的数字信息作为最优的数字信息;或者根据步骤S5得到的相似度较大的相似度矩阵,提取该相似度矩阵中的出现次数最多的数字信息作为最优的数字信息;或者根据步骤S5得到的相似度较小的相似度矩阵,首先剔除该相似度矩阵中出现较少的数字信息,然后再从该相似度矩阵中提取出现次数较多的数字信息作为最优的数字信息;S7:根据步骤S6的到的最优数字信息组合成数字信息项集合,数字信息项集合进入mongodb数字信息库中获取作为推荐结果的数字信息的详细内容,最后将所获取的数字信息的详细内容返回给当前用户。
地址 510000 广东省广州市越秀区东风东路729号
您可能感兴趣的专利