发明名称 一种基于协同过滤的RSS信息推荐方法
摘要 一种基于协同过滤的RSS信息推荐方法,属信息推荐技术领域,系统由阅读模块、订阅模块、订阅管理模块、行为记录模块、行为处理模块和推荐模块组成,其中阅读模块分别和订阅模块、订阅管理模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推荐模块相连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。本发明使其推荐效果不仅限于整个RSS信息源的推荐,更加突出了单篇文章的推荐,有效避免了信息冗余和过载;推荐效果有一定的差异覆盖面,便于用户发现可能感兴趣的新内容;引入了同好用户群,并利用同好用户加权因子,使推荐内容更加精准可信。
申请公布号 CN101753573B 申请公布日期 2012.05.23
申请号 CN200910256457.8 申请日期 2009.12.25
申请人 山东大学 发明人 袁东风;王恒;颜廷芝;徐超;林贺;陈飞;魏斌;石祚夫
分类号 H04L29/06(2006.01)I;G06F17/30(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 济南金迪知识产权代理有限公司 37219 代理人 许德山
主权项 一种基于协同过滤的RSS信息推荐方法,步骤如下:1)用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在系统中的唯一标识r,形成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户‑RSS源订阅矩阵W(m,n)之中,m为系统中的用户数目,n为RSS源的数目,订阅情况Wu,r的值当订阅时为1,未订阅时为0;2)行为处理模块从用户‑RSS源订阅矩阵W(m,n)中获取订阅情况Wu,r,利用余弦相关性算法计算两用户之间的相似度sim(ip,iq),其中ip,iq分别为p、q两名用户;并将相似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为: <mrow> <mi>sim</mi> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mi>p</mi> </msub> <mo>,</mo> <msub> <mi>i</mi> <mi>q</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>cos</mi> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mi>p</mi> </msub> <mo>,</mo> <msub> <mi>i</mi> <mi>q</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>W</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>&times;</mo> <msub> <mi>W</mi> <mrow> <mi>q</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </mrow> <msqrt> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>W</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>&times;</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>W</mi> <mrow> <mi>q</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </msqrt> </mfrac> <mo>;</mo> </mrow>3)行为处理模块根据用户相似度方阵sim(m,m)推算出与每个用户有相似订阅习惯的“同好”用户,并将该用户所有“同好”用户订阅的所有RSS源形成同好用户订阅集,再按相似度由高到低排列,形成对该用户的推荐加权系数f;4)用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在系统中的唯一标识rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中,a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目;5)行为处理模块针对同好收藏矩阵C(a,b)中单篇文章的所有同好用户行为,做推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块;6)在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能会感兴趣的TopN条内容推荐给用户。
地址 250100 山东省济南市历下区山大南路27号