发明名称 一种基于耦合主题模型的协同滤波方法
摘要 本发明公开了一种基于耦合主题模型的协同滤波方法,用于在推荐系统中有效结合历史评分信息与用户生成内容(User-generated Content,简称UGC),通过进行评分预测进行有效推荐。该方法包括以下步骤:1)获取用户生成内容的记录;2)获取用户对产品的评分记录;3)提取用户文档和产品文档;4)利用耦合主题模型学用户特征向量和产品特征向量;5)根据特征向量计算目标用户对不同产品的评分,来进行相应的产品推荐。本发明引入对用户生成内容信息的分析,能够直接的显式的发现用户兴趣和产品属性,而且有效解决了评分矩阵的稀疏问题,获得比基于用户评分信息的预测更准确的效果。
申请公布号 CN103903163A 申请公布日期 2014.07.02
申请号 CN201410069229.0 申请日期 2014.02.27
申请人 中国科学院自动化研究所 发明人 王亮;吴书;徐松
分类号 G06Q30/02(2012.01)I;G06F17/30(2006.01)I 主分类号 G06Q30/02(2012.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 1.一种基于耦合主题模型的协同滤波方法,其特征在于,该方法包括以下步骤:步骤S1,获取用户生成内容记录,每个用户生成内容对应特定的用户和产品;步骤S2,获取用户对产品的历史评分信息,将部分历史评分信息作为训练集,剩下的作为测试集,分别构建不完全观测评分矩阵,即根据部分用户对部分产品的评分构建不完全观测评分矩阵,得到的训练集评分矩阵R作为耦合主题模型的评分输入;步骤S3,根据用户生成内容,提取用户文档d<sub>U</sub>和产品文档d<sub>V</sub>,其中,所述用户文档d<sub>U</sub>为与用户有关的用户生成内容,所述产品文档d<sub>V</sub>为与产品有关的用户生成内容,每个文档使用其包括的单词的词频来表示,并将每个文档的词袋表达向量W<sub>U</sub>和W<sub>V</sub>建模为可见单元,作为耦合主题模型的内容输入;步骤S4,结合所述步骤S2得到的训练集评分矩阵R和所述步骤S3得到的用户文档d<sub>U</sub>、产品文档d<sub>V</sub>,利用耦合主题模型学习得到用户特征向量η<sub>U</sub>和产品特征向量η<sub>V</sub>;步骤S5,根据步骤S4得到的用户特征向量η<sub>U</sub>和产品特征向量η<sub>V</sub>,利用<img file="FDA0000470729120000011.GIF" wi="99" he="77" />计算用户对不同产品的评分,然后将得到的预测评分与测试集评分进行对比,衡量所述耦合主题模型的可靠性,最后针对特定用户,根据预测评分的高低得到推荐产品列表,从而进行产品推荐。
地址 100190 北京市海淀区中关村东路95号