发明名称 一种基于Web挖掘的视频推荐方法和系统
摘要 本发明公开了一种基于Web挖掘的视频推荐方法和系统,该方法首先将数据挖掘算法应用于Web挖掘用户观看视频的点击行为数据中,利用分类回归树建立用户兴趣模型,采用传统的协同过滤算法给用户推荐个性化的视频,克服了传统推荐系统由于用户评论信息少而带来的数据稀疏性问题,缓解了新用户或新项目无评分的推荐冷启动问题,提高了用户观看视频的满意度,最后将同一兴趣喜好的用户生成推荐,在视频推荐系统中实现好友推荐。
申请公布号 CN105045931A 申请公布日期 2015.11.11
申请号 CN201510557534.9 申请日期 2015.09.02
申请人 南京邮电大学 发明人 周亮;徐璐;孟浩
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京知识律师事务所 32207 代理人 汪旭东
主权项 一种基于Web挖掘的视频推荐方法,其特征在于,所述方法包括如下步骤:步骤1:通过Web挖掘对用户浏览日志进行分析,获取用户观看视频的行为和属性数据,该数据包括用户的注册信息、用户搜索视频的记录、用户观看视频记录以及用户对视频的评分;所述Web挖掘数据预处理包括四个步骤,即:数据净化、用户识别、会话识别和路径补充;步骤2:对采集后的用户数据进行预处理后存储在数据库中,从该数据库中获取每个视频的属性信息,并根据该属性信息提取用户的兴趣标记,利用分类回归树建立个性化兴趣模型;根据步骤2所述CART生成决策树时用基尼,即Gini指数选择最优特征,Gini指数计算公式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>G</mi><mi>i</mi><mi>n</mi><mi>i</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>-</mo><munderover><mo>&Sigma;</mo><mrow><mi>K</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msubsup><mi>p</mi><mi>k</mi><mn>2</mn></msubsup></mrow>]]></math><img file="FDA0000794964360000011.GIF" wi="467" he="195" /></maths>       式2式中p<sub>k</sub>是样本点属于第k类的概率;步骤3:采用协同过滤推荐算法对用户生成推荐视频;步骤4:对每个用户的兴趣喜好进行标记,把具有相同标记的用户划归为一个类,在同一个类中的用户之间实现相互推荐。
地址 210003 江苏省南京市鼓楼区新模范马路66号