发明名称 |
一种基于耦合主题模型的协同滤波方法 |
摘要 |
本发明公开了一种基于耦合主题模型的协同滤波方法,用于在推荐系统中有效结合历史评分信息与用户生成内容(User-generated Content,简称UGC),通过进行评分预测进行有效推荐。该方法包括以下步骤:1)获取用户生成内容的记录;2)获取用户对产品的评分记录;3)提取用户文档和产品文档;4)利用耦合主题模型学用户特征向量和产品特征向量;5)根据特征向量计算目标用户对不同产品的评分,来进行相应的产品推荐。本发明引入对用户生成内容信息的分析,能够直接的显式的发现用户兴趣和产品属性,而且有效解决了评分矩阵的稀疏问题,获得比基于用户评分信息的预测更准确的效果。 |
申请公布号 |
CN103903163A |
申请公布日期 |
2014.07.02 |
申请号 |
CN201410069229.0 |
申请日期 |
2014.02.27 |
申请人 |
中国科学院自动化研究所 |
发明人 |
王亮;吴书;徐松 |
分类号 |
G06Q30/02(2012.01)I;G06F17/30(2006.01)I |
主分类号 |
G06Q30/02(2012.01)I |
代理机构 |
中科专利商标代理有限责任公司 11021 |
代理人 |
宋焰琴 |
主权项 |
1.一种基于耦合主题模型的协同滤波方法,其特征在于,该方法包括以下步骤:步骤S1,获取用户生成内容记录,每个用户生成内容对应特定的用户和产品;步骤S2,获取用户对产品的历史评分信息,将部分历史评分信息作为训练集,剩下的作为测试集,分别构建不完全观测评分矩阵,即根据部分用户对部分产品的评分构建不完全观测评分矩阵,得到的训练集评分矩阵R作为耦合主题模型的评分输入;步骤S3,根据用户生成内容,提取用户文档d<sub>U</sub>和产品文档d<sub>V</sub>,其中,所述用户文档d<sub>U</sub>为与用户有关的用户生成内容,所述产品文档d<sub>V</sub>为与产品有关的用户生成内容,每个文档使用其包括的单词的词频来表示,并将每个文档的词袋表达向量W<sub>U</sub>和W<sub>V</sub>建模为可见单元,作为耦合主题模型的内容输入;步骤S4,结合所述步骤S2得到的训练集评分矩阵R和所述步骤S3得到的用户文档d<sub>U</sub>、产品文档d<sub>V</sub>,利用耦合主题模型学习得到用户特征向量η<sub>U</sub>和产品特征向量η<sub>V</sub>;步骤S5,根据步骤S4得到的用户特征向量η<sub>U</sub>和产品特征向量η<sub>V</sub>,利用<img file="FDA0000470729120000011.GIF" wi="99" he="77" />计算用户对不同产品的评分,然后将得到的预测评分与测试集评分进行对比,衡量所述耦合主题模型的可靠性,最后针对特定用户,根据预测评分的高低得到推荐产品列表,从而进行产品推荐。 |
地址 |
100190 北京市海淀区中关村东路95号 |