发明名称 一种引入社会化标签的协作过滤评分预测方法及装置
摘要 本发明涉及一种引入社会化标签的协作过滤评分预测方法及装置。该方法包括:步骤1,计算基于社会化标签的条目相似度;步骤2,计算基于打分的条目相似度;步骤3,根据基于社会化标签的条目相似度和基于打分的条目相似度计算出最终的条目相似度;步骤4,根据最终的条目相似度预测评分。本发明将具有语义信息和反映了用户主观判断的社会化标签引入了协作过滤的评分流程,在一定程度上提升了经典的协作过滤的预测准确度,能够更准确地为用户提供个性化服务。
申请公布号 CN102156747B 申请公布日期 2013.05.29
申请号 CN201110100480.5 申请日期 2011.04.21
申请人 清华大学 发明人 赵洋;张勇;邢春晓;夏双
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京聿宏知识产权代理有限公司 11372 代理人 吴大建;刘华联
主权项 1.一种引入社会化标签的协作过滤评分预测方法,其特征在于,包括: 步骤1,计算基于社会化标签的条目相似度; 步骤2,计算基于打分的条目相似度; 步骤3,根据基于社会化标签的条目相似度和基于打分的条目相似度计算出最终的条目相似度; 步骤4,根据最终的条目相似度预测评分;其中,步骤1包括: 步骤10,对包含社会化标签的数据集进行预处理; 步骤11,计算社会化标签的评分稳定性; 步骤12,根据相似度度量方法计算基于社会化标签的条目相似度, 其中,在步骤11中,按照下述公式计算社会化标签的评分稳定性: <img file="FDA00002764951400011.GIF" wi="286" he="108" />其中:<img file="FDA00002764951400012.GIF" wi="512" he="117" />T’表示集合<img file="FDA00002764951400013.GIF" wi="1283" he="67" /><img file="FDA00002764951400014.GIF" wi="1058" he="67" />itemi表示条目;n<sub>itemi</sub>表示社会化标签标注条目itemi的次数,<img file="FDA00002764951400015.GIF" wi="83" he="67" />表示用户对条目itemi的平均评分;i为自然数;m是集合T’中元素的个数;y表示社会化被标签标注过的条目的平均评分的加权平均, <img file="FDA00002764951400016.GIF" wi="509" he="103" />其中,步骤3中,按照下述公式计算最终的条目相似度: <img file="FDA00002764951400017.GIF" wi="848" he="136" />其中,sim<sub>m</sub>'(i,j)是通过标签信息计算的条目i与条目j的相似度,sim<sub>p</sub>'(i,j)是通过评分信息计算的条目i与条目j的相似度;ω<sub>m</sub>是标签相似度的权重,ω<sub>p</sub>是评分相似度的权重, 其中,步骤4中,按照下述公式根据最终的条目相似度预测评分: <img file="FDA00002764951400021.GIF" wi="965" he="183" />其中P<sub>u,i</sub>是用户u对条目i的评分预测的结果,R<sub>u,j</sub>是用户u在条目j上的评分,<img file="FDA00002764951400022.GIF" wi="49" he="65" />是用户u上所有评分的平均值,Item是用户u评分过的条目的集合。
地址 100084 北京市海淀区北京市100084信箱82分箱清华大学专利办公室