发明名称 用户可信度和项目最近邻相结合的互联网推荐方法
摘要 本发明公开了一种用户可信度和项目最近邻相结合的互联网推荐方法,该方法首先建立用户间的可信度DAG图,接着计算第<i>s</i>步在用户<i>u</i>停止随机漫步的概率,然后设定随机漫步的结束条件,并根据随机漫步条件预测用户<i>u</i>对目标项目<i>i</i>的评分<img file="2011100726734100004dest_path_image001.GIF" wi="30" he="38" />,最后根据预测的评分将用户<i>u</i>最有可能感兴趣的<i>N</i>个项目推荐给该用户。该方法不仅考虑可信用户的评分,同时考虑该项目的相似邻居,推荐结果准确。
申请公布号 CN102135999A 申请公布日期 2011.07.27
申请号 CN201110072673.4 申请日期 2011.03.25
申请人 南京财经大学 发明人 曹杰;伍之昂;王有权;李秀怡
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京汇盛专利商标事务所(普通合伙) 32238 代理人 陈扬
主权项 1.一种用户可信度和项目最近邻相结合的互联网推荐方法,其特征在于该方法首先建立用户间的可信度DAG图,接着计算第<i>s</i>步在用户<i>u</i>停止随机漫步的概率,然后设定随机漫步的结束条件,并根据随机漫步条件预测用户<i>u</i>对目标项目<i>i</i>的评分<img file="512585DEST_PATH_IMAGE001.GIF" wi="30" he="38" />,最后根据预测的评分将用户<i>u</i>最有可能感兴趣的<i>N</i>个项目推荐给该用户,具体实施步骤如下:1)输入用户-项目评分矩阵和可信网络,其中用户-项目评分矩阵是根据用户集合<i>U</i>和项目集合<i>I</i>,用户集合<i>U</i>和项目集合<i>I</i>构成一个<i>m</i>*<i>n</i>阶矩阵<i>R</i>(<i>m,n</i>),其中<i>Ru,i</i>表示用户<i>u</i>对项目<i>i</i>的评分,如果用户<i>u</i>未对项目<i>i</i>评分,则将其评分值设定为0,每个用户<i>u</i>评分的项目集合用<i>Iu</i>表示;对于可信网络,如果用户<i>u</i>对用户<i>v</i>信任,则<i>tu,v</i>表示代表了用户<i>u</i>对用户<i>v</i>的可信值,0表示不信任,而1表示完全信任;定义<i>TUu=</i>{<i>v</i><img file="303824DEST_PATH_IMAGE002.GIF" wi="17" he="17" /><i>U</i>| <i>tu,v</i> =1},该集合定义了用户<i>u</i>直接可信的用户集合,则可信网络可定义成一个DAG图G=&lt;<i>u</i>,<i>Tu</i>&gt;,其中<i>Tu</i>={(<i>u</i>, <i>v</i>)|<i>u</i><img file="450814DEST_PATH_IMAGE002.GIF" wi="17" he="17" /><i>U</i>, <i>v</i><img file="948792DEST_PATH_IMAGE002.GIF" wi="17" he="17" /><i> TUu</i> },其中该图的顶点表示每一个用户,而边表示两顶点的信任关系;2)将<i>u</i>作为源点,计算停留在用户<i>u</i>上的停止概率,然后随机判定是否停留在用户<i>u</i>上,如果选择停留,则跳转到步骤5),否则执行步骤3);停留在用户<i>u</i>上的停止概率的计算公式如式(1)所示:<img file="517177DEST_PATH_IMAGE003.GIF" wi="246" he="54" />(1)其中<i>Iu</i>表示用户<i>u</i>评过分的项目集合,<img file="733394DEST_PATH_IMAGE004.GIF" wi="105" he="38" />表示<i>Iu</i>中的元素与目标项目<i>i</i>相似度的最大值;其中<i>sim</i>(<i>i,j</i>)的计算公式如式(2)所示:<img file="678216DEST_PATH_IMAGE005.GIF" wi="204" he="60" />(2)其中|<i>Uij</i>|表示同时对目标项目<i>i</i>和项目<i>j</i>进行评分的用户集合的个数,<i>corr</i>(<i>i, j</i>)的计算公式如式(3)所示:<img file="93017DEST_PATH_IMAGE006.GIF" wi="284" he="87" />(3)其中<i>Ru,i</i>表示用户<i>u</i>对项目<i>i</i>的评分值,<img file="35565DEST_PATH_IMAGE007.GIF" wi="21" he="21" />表示用户<i>u</i>评分的项目集合<i>Iu</i>的均值,<i>Uij</i>表示同时对项目<i>i</i>和项目<i>j</i>评过分的用户集合;3)假设第<i>s</i>步漫步到用户<i>v</i>,如果用户<i>v</i>对目标项目<i>i</i>已经评分,则结束随机漫步,跳转到步骤6);如果用户<i>v</i>未对目标项目<i>i</i>评分,则随机的决定是否停留在用户<i>v</i>上,如果选择停留在<i>v</i>上,则结束随机漫步,跳转到步骤7),否则跳转到步骤4);4)在用户<i>v</i>的直接可信集合<i>TUv</i>中随机选择一个用户<i>w</i>,如果用户<i>w</i>对目标项目<i>i</i>已经评分,则结束随机漫步,跳转到步骤6);如果随机漫步的步长大于等于深度阈值6,则结束随机漫步并跳转到步骤7);否则跳转到步骤3);第<i>s</i>步在用户<i>v</i>且第<i>s</i>+1步在用户<i>w</i>的概率的计算公式如式(4)所示:<img file="535817DEST_PATH_IMAGE008.GIF" wi="197" he="51" />(4)其中|<i> TUv</i> |表示用户<i>v</i>直接可信的用户集合的个数,<img file="956434DEST_PATH_IMAGE009.GIF" wi="13" he="26" /><i>v,i,s</i>表示用户停留在用户<i>v</i>上的概率,其计算公式如式(5)所示:<img file="491321DEST_PATH_IMAGE010.GIF" wi="207" he="63" />(5)其中<i>s</i>表示随机漫步的步长,<i>Iv</i>表示用户<i>v</i>评过分的项目集合,<img file="401508DEST_PATH_IMAGE011.GIF" wi="75" he="27" />表示<i>Iv</i>中的集合中与目标项目<i>i</i>相似度的最大值;5)预测在线用户<i>u</i>对目标项目<i>i</i>的评分,其预测公式如(6)所示:<img file="326738DEST_PATH_IMAGE012.GIF" wi="231" he="71" />(6)其中<img file="613363DEST_PATH_IMAGE009.GIF" wi="13" he="26" /><i>u,i,</i>1表示随机漫步停留在用户<i>u</i>上的概率,<i>Iu</i>表示用户<i>u</i>评过分的项目集合,<i>Ru,l</i>表示用户<i>u</i>对项目<i>l</i>的评分,<i>sim</i>(<i>i,j</i>)表示项目<i>i</i>和项目<i>j</i>的相似度;6)定义用户<i>u</i>到用户<i>v</i>所经过的路径顶点集合为<i>Suv</i>,首先计算用户<i>u</i>到用户<i>v</i>的路径长度,其计算公式如式(7)所示:<img file="940439DEST_PATH_IMAGE013.GIF" wi="270" he="48" />(7)其中,<i>w</i>表示<i>Suv</i>中<i>v</i>的前一顶点,定义<img file="287107DEST_PATH_IMAGE014.GIF" wi="54" he="21" />=1,预测在线用户<i>u</i>对目标项目<i>i</i>的评分,其预测公式如式(8)所示:<img file="699634DEST_PATH_IMAGE015.GIF" wi="228" he="96" />(8)其中<i>Rv,i</i>表示用户<i>v</i>对目标项目的评分,根据步骤3)的说明可知该随机漫步停留在了用户<i>v</i>上,|<i>Suv</i>|表示路径顶点集合的个数,其值小于6;7)预测在线用户<i>u</i>对目标项目<i>i</i>的评分,其预测公式如(9)所示:<img file="524370DEST_PATH_IMAGE016.GIF" wi="336" he="96" />(9)该步骤中|<i>Suv</i>|表示路径顶点集合的个数,|<i>Suv</i>|最大值为深度阈值6,然后结束随机漫步,并在该用户上来预测在线用户对目标项目<i>i</i>的评分,<i>Iv</i>表示用户v评过分的项目集合;8)根据预测的评分将在线用户<i>u</i>最有可能感兴趣的<i>N</i>个项目推荐给该用户。
地址 210003 江苏省南京市铁路北街128号