主权项 |
一种基于Web挖掘的视频推荐方法,其特征在于,所述方法包括如下步骤:步骤1:通过Web挖掘对用户浏览日志进行分析,获取用户观看视频的行为和属性数据,该数据包括用户的注册信息、用户搜索视频的记录、用户观看视频记录以及用户对视频的评分;所述Web挖掘数据预处理包括四个步骤,即:数据净化、用户识别、会话识别和路径补充;步骤2:对采集后的用户数据进行预处理后存储在数据库中,从该数据库中获取每个视频的属性信息,并根据该属性信息提取用户的兴趣标记,利用分类回归树建立个性化兴趣模型;根据步骤2所述CART生成决策树时用基尼,即Gini指数选择最优特征,Gini指数计算公式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>G</mi><mi>i</mi><mi>n</mi><mi>i</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>-</mo><munderover><mo>Σ</mo><mrow><mi>K</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msubsup><mi>p</mi><mi>k</mi><mn>2</mn></msubsup></mrow>]]></math><img file="FDA0000794964360000011.GIF" wi="467" he="195" /></maths> 式2式中p<sub>k</sub>是样本点属于第k类的概率;步骤3:采用协同过滤推荐算法对用户生成推荐视频;步骤4:对每个用户的兴趣喜好进行标记,把具有相同标记的用户划归为一个类,在同一个类中的用户之间实现相互推荐。 |