发明名称 一种基于用户实时兴趣向量的电影个性化推荐方法
摘要 本发明公开了一种综合电影内容和用户实时评分信息的电影个性化推荐方法,主要解决传统推荐算法不能及时反映用户的兴趣变化和数据稀疏性的问题。为了解决数据稀疏性问题,本发明引入了用户兴趣向量。从电影特征向量入手,借助用户的评分矩阵以迭代的方式处理得到用户的兴趣特征向量,根据得到的用户特征向量构建用户相似矩阵,最终根据传统的协同过滤评分预测公式完成推荐。针对用户兴趣变化的情况,在构建用户兴趣向量过程中又融入了时间因子,使得越接近当前时间的评分行为权重越大,越能表现用户的兴趣。
申请公布号 CN104063481A 申请公布日期 2014.09.24
申请号 CN201410313446.X 申请日期 2014.07.02
申请人 山东大学 发明人 孙建德;徐文涛;李静
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 济南圣达知识产权代理有限公司 37221 代理人 李健康
主权项 一种基于用户实时兴趣向量的电影个性化推荐方法,其特征在于该方法包括如下步骤:步骤一:根据电影的元信息对每部电影的特征属性进行建模,得到电影的特征向量,电影t<sub>i</sub>的特征向量表示为<img file="FDA0000531956140000011.GIF" wi="526" he="68" />其中<img file="FDA0000531956140000012.GIF" wi="79" he="62" />由下式得到:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>w</mi><msub><mi>t</mi><msub><mi>i</mi><mi>j</mi></msub></msub></msub><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>0</mn><mo>,</mo></mtd><mtd><msub><mi>p</mi><mi>j</mi></msub><mo>&NotElement;</mo><msub><mi>t</mi><mi>i</mi></msub></mtd></mtr><mtr><mtd><mo>+</mo><mn>1</mn><mo>,</mo></mtd><mtd><msub><mi>p</mi><mi>j</mi></msub><mo>&Element;</mo><msub><mi>t</mi><mi>i</mi></msub></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000531956140000013.GIF" wi="424" he="123" /></maths>即若该电影中包含表示电影元信息的属性p<sub>j</sub>,则该属性对应的权值<img file="FDA0000531956140000014.GIF" wi="79" he="62" />加1,如果该电影中不包含属性p<sub>j</sub>,则该属性对应的权值<img file="FDA0000531956140000015.GIF" wi="79" he="62" />为零,T={t<sub>1</sub>,t<sub>2</sub>,...,t<sub>n</sub>}表示电影的集合;步骤二:由用户的实时评分信息和所述电影特征向量得到用户的实时兴趣向量,用户集合表示为U={u<sub>1</sub>,u<sub>2</sub>,...,u<sub>n</sub>},用户u<sub>i</sub>的实时兴趣向量表示为<img file="FDA0000531956140000016.GIF" wi="554" he="68" />其中<img file="FDA0000531956140000017.GIF" wi="85" he="62" />表示用户u<sub>i</sub>对属性p<sub>j</sub>的喜爱程度,用户u<sub>i</sub>的实时兴趣向量<img file="FDA0000531956140000018.GIF" wi="65" he="58" />是由u<sub>i</sub>已评分电影的特征向量<img file="FDA0000531956140000019.GIF" wi="58" he="64" />的加权和,权重是用户对电影的实时喜好程度;步骤三:结合所述步骤二得到的用户兴趣向量和用户的评分信息对电影特征向量进行更新,生成更加合理的电影特征向量。步骤四:由所述步骤二和所述步骤三形成迭代过程,对用户的实时兴趣向量进行更新,得到更加准确的用户实时兴趣向量;步骤五:由所述更加准确的用户实时兴趣向量建立用户的相似性矩阵,进而得到目标用户的邻居用户,根据基于用户的协同过滤算法的评分预测公式打相应的评分,最终完成topN推荐列表。
地址 250100 山东省济南市历城区山大南路27号