发明名称 一种组合协同过滤IPTV节目推荐方法
摘要 本发明提供了一种组合协同过滤IPTV节目推荐方法,首先为节目构建用户-节目评分矩阵,其次利用基于物品协同过滤为原始用户-节目评分矩阵进行填充,然后把填充的用户-节目评分矩阵作为奇异值分解技术的输入,通过奇异值分解技术能够将原始用户-节目评分矩阵重新填充而得到一个无缺失值的用户-节目评分矩阵,最后将无缺失值的用户-节目评分矩阵再次使用基于物品的协同过滤方法预测出原始矩阵中未评分项的评分,把预测评分最高的N个节目,作为协同过滤的推荐结果。
申请公布号 CN105282616A 申请公布日期 2016.01.27
申请号 CN201510777034.6 申请日期 2015.11.13
申请人 云南大学 发明人 李浩;夏欢;康雁
分类号 H04N21/466(2011.01)I;H04N21/25(2011.01)I 主分类号 H04N21/466(2011.01)I
代理机构 北京科亿知识产权代理事务所(普通合伙) 11350 代理人 汤东凤
主权项 一种组合协同过滤IPTV节目推荐方法,其特征在于,包括以下步骤:步骤①:从用户评分数据库读取用户评分数据;步骤②:用所述步骤①中的用户评分数据定义一个m×n的原始评分矩阵R,表示m个用户在n个节目上的评分;利用协同过滤方法,计算节目之间的相似度sim(i,j),并求出目标用户u对节目j的预测评分值Pre<sub>u,j</sub>,最后用预测评分值Pre<sub>u,j</sub>填充原始评分矩阵R得到矩阵R<sub>pre</sub>;步骤③:若所述步骤②中的矩阵R<sub>pre</sub>没有完全填充,首先计算出R<sub>pre</sub>中的每列平均值<img file="FDA0000845800520000011.GIF" wi="81" he="85" />之后用每列平均值<img file="FDA0000845800520000012.GIF" wi="63" he="86" />填充该列的空缺项;然后用每列的所有评分项减去目标节目所在行的行平均值<img file="FDA0000845800520000013.GIF" wi="62" he="76" />得到规范化的矩阵R<sub>norm</sub>;步骤④:用奇异值分解方法分解所述步骤③中的矩阵R<sub>norm</sub>得到矩阵U,S,V;它们的大小分别为m×m,m×n,n×n;它们之间的关系是R<sub>norm</sub>=U×S×V<sup>T</sup>;步骤⑤:通过保留所述步骤④中矩阵S的k个对角元素来获得一个k×k的矩阵S<sub>k</sub>,所述步骤④中矩阵U和矩阵V也相应简化为U<sub>k</sub>和V<sub>k</sub>,它们的大小分别为m×k和n×k;步骤⑥:利用所述步骤⑤中简化的矩阵S<sub>k</sub>,U<sub>k</sub>,V<sub>k</sub>,将m个用户在k维特征空间中表示为<img file="FDA0000845800520000014.GIF" wi="263" he="92" />n个节目在k维特征空间中表示为<img file="FDA0000845800520000015.GIF" wi="279" he="95" />然后运用公式<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>Pre</mi><mrow><mi>u</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>=</mo><mover><msub><mi>R</mi><mi>u</mi></msub><mo>&OverBar;</mo></mover><mo>+</mo><msub><mi>U</mi><mi>k</mi></msub><msqrt><msub><mi>S</mi><mi>k</mi></msub></msqrt><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>&times;</mo><msqrt><msub><mi>S</mi><mi>k</mi></msub></msqrt><msubsup><mi>V</mi><mi>k</mi><mi>T</mi></msubsup><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000845800520000016.GIF" wi="898" he="94" /></maths>计算目标用户u在节目i上的预测评分值Pre<sub>u,i</sub>,其中<img file="FDA0000845800520000017.GIF" wi="84" he="79" />表示目标用户u的所有已评分项目上评分的平均值,<img file="FDA0000845800520000018.GIF" wi="245" he="91" />代表矩阵<img file="FDA0000845800520000019.GIF" wi="174" he="93" />的第i列,<img file="FDA00008458005200000110.GIF" wi="255" he="92" />代表矩阵<img file="FDA00008458005200000111.GIF" wi="175" he="89" />的第u行;使用本次预测评分值Pre<sub>u,i</sub>填充所述步骤②中的原始评分矩阵R,从而得到一个无缺失值的评分矩阵R<sub>filled</sub>;步骤⑦:基于所述步骤⑥中的评分矩阵R<sub>filled</sub>,利用协同过滤方法,计算节目i与节目j的相似度sim(i,j),进而求出目标用户u对节目j的预测评分值Pre<sub>u,j</sub>;当得到了预测评分值之后,把预测评分值最高的N个节目,作为此次协同过滤的推荐结果。
地址 650091 云南省昆明市翠湖北路2号云南大学科学馆524