一种基于耦合主题模型的协同滤波方法,申请号CN201410069229.0-传众专利搜索

发明名称	一种基于耦合主题模型的协同滤波方法
摘要	本发明公开了一种基于耦合主题模型的协同滤波方法，用于在推荐系统中有效结合历史评分信息与用户生成内容(User-generated Content，简称UGC)，通过进行评分预测进行有效推荐。该方法包括以下步骤：1)获取用户生成内容的记录；2)获取用户对产品的评分记录；3)提取用户文档和产品文档；4)利用耦合主题模型学用户特征向量和产品特征向量；5)根据特征向量计算目标用户对不同产品的评分，来进行相应的产品推荐。本发明引入对用户生成内容信息的分析，能够直接的显式的发现用户兴趣和产品属性，而且有效解决了评分矩阵的稀疏问题，获得比基于用户评分信息的预测更准确的效果。
申请公布号	CN103903163A	申请公布日期	2014.07.02
申请号	CN201410069229.0	申请日期	2014.02.27
申请人	中国科学院自动化研究所	发明人	王亮;吴书;徐松
分类号	G06Q30/02(2012.01)I;G06F17/30(2006.01)I	主分类号	G06Q30/02(2012.01)I
代理机构	中科专利商标代理有限责任公司 11021	代理人	宋焰琴
主权项	1.一种基于耦合主题模型的协同滤波方法，其特征在于，该方法包括以下步骤：步骤S1，获取用户生成内容记录，每个用户生成内容对应特定的用户和产品；步骤S2，获取用户对产品的历史评分信息，将部分历史评分信息作为训练集，剩下的作为测试集，分别构建不完全观测评分矩阵，即根据部分用户对部分产品的评分构建不完全观测评分矩阵，得到的训练集评分矩阵R作为耦合主题模型的评分输入；步骤S3，根据用户生成内容，提取用户文档d<sub>U</sub>和产品文档d<sub>V</sub>，其中，所述用户文档d<sub>U</sub>为与用户有关的用户生成内容，所述产品文档d<sub>V</sub>为与产品有关的用户生成内容，每个文档使用其包括的单词的词频来表示，并将每个文档的词袋表达向量W<sub>U</sub>和W<sub>V</sub>建模为可见单元，作为耦合主题模型的内容输入；步骤S4，结合所述步骤S2得到的训练集评分矩阵R和所述步骤S3得到的用户文档d<sub>U</sub>、产品文档d<sub>V</sub>，利用耦合主题模型学习得到用户特征向量η<sub>U</sub>和产品特征向量η<sub>V</sub>；步骤S5，根据步骤S4得到的用户特征向量η<sub>U</sub>和产品特征向量η<sub>V</sub>，利用<img file="FDA0000470729120000011.GIF" wi="99" he="77" />计算用户对不同产品的评分，然后将得到的预测评分与测试集评分进行对比，衡量所述耦合主题模型的可靠性，最后针对特定用户，根据预测评分的高低得到推荐产品列表，从而进行产品推荐。
地址	100190 北京市海淀区中关村东路95号