发明名称 基于相似性传递的协同过滤方法及系统
摘要 本发明涉及推荐技术领域,特别涉及基于相似性传递的协同过滤方法及系统。本发明所采用的方法:遍历所有用户的历史行为数据,获得描述所有用户对物品过往喜好的关系向量;应用关系向量设定阈值,计算各个用户间的相似性;利用相似性传递计算原则计算前述矩阵中相似性值为零的目标用户与其他用户间相似性;根据与目标用户相似程度最高的其他用户对目标用户未选择物品的喜好程度得到当前用户对未选择物品的喜好程度的估计值;对每个用户的预测结果进行筛选,产生对每个用户的推荐物品。本发明的系统包括以下模块:数据关系向量模块;阈值判定模块;相似性传递计算模块;喜好程度估值模块;预测筛选模块。
申请公布号 CN103309967B 申请公布日期 2016.10.26
申请号 CN201310221379.4 申请日期 2013.06.05
申请人 清华大学 发明人 谢峰;陈震;许宏峰;曹军威
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 王莹
主权项 一种基于相似性传递的协同过滤方法,其特征在于,该方法包含以下步骤:1)遍历所有用户的历史行为数据,获得描述所有用户对物品过往喜好的关系向量;2)应用关系向量,并设定阈值,根据阈值临界原则计算各个用户间的相似性并得到大小为用户数×用户数的初始相似性矩阵;3)根据初始相似性矩阵中不为零的相似性值,利用相似性传递计算方法计算前述矩阵中相似性值为零的目标用户与其他用户间相似性,最终得到更密集的相似性矩阵;采用以下公式获取更密集的相似性矩阵:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>s</mi><mi>i</mi><mi>m</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mo>|</mo><mi>U</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow></mfrac><munder><mo>&Sigma;</mo><mrow><mi>w</mi><mo>&Element;</mo><mi>U</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow></munder><mo>(</mo><msup><mi>sim</mi><mi>l</mi></msup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>w</mi><mo>)</mo></mrow><mo>&times;</mo><mfrac><mrow><msup><mi>sim</mi><mi>l</mi></msup><mrow><mo>(</mo><mi>w</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow><mrow><munder><mo>&Sigma;</mo><mrow><mi>z</mi><mo>&Element;</mo><mi>U</mi><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow></mrow></munder><msup><mi>sim</mi><mi>l</mi></msup><mrow><mo>(</mo><mi>w</mi><mo>,</mo><mi>z</mi><mo>)</mo></mrow></mrow></mfrac><mo>)</mo></mrow>]]></math><img file="FDA0000994664840000011.GIF" wi="1099" he="230" /></maths>公式中,U(u,v)表示同时与用户u和用户v之间的初始相似程度不为零的用户集合,|U(u,v)|表示同时与用户u和用户v之间的初始相似程度不为零的用户数目,若数目为零,则sim(u,v)=0,U(w)表示与用户w之间的初始相似程度不为零的用户集合;sim<sup>l</sup>(u,v)表示用户u和用户v之间的相似程度;sim<sup>l</sup>(w,v)表示用户w和用户v之间的相似程度;sim<sup>l</sup>(w,z)表示用户w和用户z之间的相似程度;4)根据与目标用户相似程度最高的其他用户对目标用户未选择物品的喜好程度得到当前用户对未选择物品的喜好程度的估计值;5)对每个用户的预测结果进行筛选,产生对每个用户的推荐物品。
地址 100084 北京市海淀区清华园100084-82信箱