发明名称 一种评分预测方法与系统
摘要 本发明公开了一种评分预测方法与系统,获取历史评论数据,使用基于词向量的方法构建主题词分布表,根据主题词分布表计算指定的第一用户对第一物品的评论特征表示,同时获取历史评分数据,计算指定的第一用户对第一物品的修正平均分作为特征之一,与主题特征一起作为线性回归模型的特征,计算出各个特征的权重和误差偏置,针对需要预测的第二用户对第二物品的评分,首先计算出第二用户对第二物品的评论特征表示和修正平均分,结合主题权重和误差偏置获得第二用户对第二物品的评分。利用词向量方法构建主题词表,根据评论内容预测评分同时从用户角度以及物品角度进行考虑,并加之协同过滤算法得到组合推荐模型,使预测结果更加准确全面。
申请公布号 CN104715399A 申请公布日期 2015.06.17
申请号 CN201510165907.8 申请日期 2015.04.09
申请人 苏州大学 发明人 陈文亮;马春平
分类号 G06Q30/02(2012.01)I 主分类号 G06Q30/02(2012.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 罗满
主权项 一种评分预测方法,其特征在于,包括:获取历史评分数据,利用协同过滤算法根据第一用户对所有物品的评分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分以及对预设物品范围物品评分的平均分得到第一用户对第一物品的修正平均分;获取历史评论数据,计算第一用户对第一物品的评论的多个预设主题的特征值,根据所述特征值得到第一用户对第一物品的评论的特征表示;根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、所述修正平均分的权重以及误差偏置;确定要进行评分预测的第二用户以及第二物品;利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分以及对预设物品范围物品评分的平均分得到第二用户对第二物品的修正平均分;计算第二用户对第二物品的评论的各主题的特征值,根据第二用户对第二物品的评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品各主题的特征值;根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示;根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、所述各主题的权重、所述修正平均分的权重以及误差偏置计算出所述第二用户对第二物品的预测评分;其中,计算特征值包括:将所述历史评论数据中的词表示为词向量;根据所述词向量得到与各主题相似的对应的预设数目的目标代表词;根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值。
地址 215123 江苏省苏州市工业园区仁爱路199号