发明名称 | 一种基于提升树的电影评分分布预测方法及系统 | ||
摘要 | 本发明公开了一种基于提升树的电影评分分布预测方法,首先获取用于训练的每部电影的特征向量和评分分布向量;然后基于得到的特征向量和评分分布向量,训练提升树模型。该模型以向量回归树作为基函数,K-L损失作为评价预测分布和真实分布的损失函数,采用前向分步算法在每一轮的加性迭代过程中,利用损失函数对基函数的梯度和二阶偏导数在当前模型中的值拟合一个新的向量回归树;接着选择合适的收缩因子对其进行组合,得到最终用于电影评分分布预测的模型;最后获取未上映待进行评分分布预测的电影的特征向量,通过评分分布预测模型对其进行预测。本发明还公开了一种基于提升树的电影评分分布预测系统。本发明可以快速、有效地训练出用于电影评分分布预测的模型,并且预测的准确度领先于已有方法。 | ||
申请公布号 | CN105654205A | 申请公布日期 | 2016.06.08 |
申请号 | CN201511029548.X | 申请日期 | 2015.12.31 |
申请人 | 东南大学 | 发明人 | 耿新;邢超 |
分类号 | G06Q10/04(2012.01)I | 主分类号 | G06Q10/04(2012.01)I |
代理机构 | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人 | 柏尚春 |
主权项 | 一种基于提升树的电影评分分布预测方法,其特征在于,包括如下步骤:1)获取用于训练的每部电影的特征向量;2)收集用于训练的每部电影对应的评分投票数,将所有评分投票数进行归一化处理后得到对应的评分分布向量;3)基于步骤1)中得到的电影特征向量和步骤2)中得到的评分分布向量训练提升树模型,该模型采用加法模型与前向分步算法,以向量回归树作为基函数,K‑L损失作为评价预测分布和真实分布的损失函数,采用前向分步算法在每一轮的加性迭代过程中,利用损失函数对基函数的梯度和二阶偏导数在当前模型中的值拟合一个新的向量回归树;4)对步骤3)中得到的每一轮中的向量回归树进行加性组合,得到最终用于电影评分分布预测的模型;5)获取未上映待进行评分分布预测的电影的特征向量,通过步骤4)得到的电影评分分布预测模型对其进行预测,得到一个评分分布向量,即得该电影上映后观众评分分布的预测结果。 | ||
地址 | 210096 江苏省南京市玄武区四牌楼2号 |