发明名称 一种基于商品属性熵值的个性化推荐方法
摘要 一种基于商品属性熵值的个性化推荐方法,通过脚本获取电子商务网站用户的浏览记录,对其进行剖析,产生推荐结果进行个性化推荐。本发明基于属性分类熵值的用户剖面可以帮助推荐算法找到用户在不同属性分类上的偏好,利用用户浏览过程中的信息,根据用户的实际选择产生不同推荐,从而提高商品页面推荐的多样性。对于一个需要个性化推荐的推荐系统,本发明在保持推荐命中率的同时,还提高推荐的多样性。本发明方法还可以在不进行大量更改的前提下,对其它推荐算法产生的结果进行重新排序,这样一方面使得原有推荐算法的效果不受影响,另一方面提高了商品页个性化推荐的多样性,从而使商品页的推荐更为有效。
申请公布号 CN102411754A 申请公布日期 2012.04.11
申请号 CN201110385722.X 申请日期 2011.11.29
申请人 南京大学 发明人 陈振宇;都兴中;刘嘉;惠成峰;何铁科
分类号 G06Q30/02(2012.01)I 主分类号 G06Q30/02(2012.01)I
代理机构 南京天翼专利代理有限责任公司 32112 代理人 黄明哲
主权项 1.一种基于商品属性熵值的个性化推荐方法,其特征是通过脚本获取电子商务网站用户的浏览记录,对其进行剖析,产生推荐结果进行个性化推荐,包括以下步骤:1)数据清洗,根据已有用户浏览的商品记录获取用户在不同分类属性上的分布:1.1)在已有用户数据中,根据所需的用户浏览记录的特征,选取提供个性化推荐的用户群体;1.2)提取所选取的用户群体在电子商务网站上对商品页的浏览记录;1.3)根据浏览记录,收集商品规格信息,作为下一阶段的属性值,所述规格信息为用于用户鉴别商品,获取用户在不同分类的属性上的分布;2)熵值优化,根据每个分类中的属性的分布情况进行熵值计算并进行权值化:2.1)根据电子商务网站已有的用户、用户浏览记录、商品的属性值,由推荐算法产生通用推荐集合,所述推荐算法为内容过滤或协同过滤,通用推荐集合是一个偏序集,集合包括商品在推荐系统中唯一的标示符,以及根据推荐算法得出的排序结果;2.2)根据当前用户选择的商品产生推荐候选集:使用当前用户正在浏览的商品在电子商务站点中唯一的标示,即电子商务运营者分配给不同产品的产品id或uri,从通用推荐集合检索与商品具有关联性的所有商品,产生推荐候选集,并根据用户正在浏览的商品,对推荐候选集中的商品进行属性值匹配,设共有m个属性分类,属性匹配向量表示为B={b<sub>1</sub>,b<sub>2</sub>,b<sub>3</sub>,...,b<sub>m</sub>},0表示属性不匹配,1表示属性匹配,那么对于推荐候选集中的第k个商品,其对应的匹配向量可以记做B<sub>k</sub>;推荐候选集是通用推荐集合的一个子集,通过使用用户当前的个人信息、浏览信息对通用推荐集合中的内容进行选择、排序后产生;2.3)根据通用推荐集合中的商品,计算全局熵值:根据通用推荐集合中的商品,对不同商品在各个属性分类上出现的比例进行统计,统计的过程是:首先构建属性分类表,然后遍历商品数据库,根据每个商品的属性对应的分类将属性添加到属性分类表中,并对重复的项进行计数,直到遍历结束为止;设一个属性分类中包括n种分类标签,不同分类标签出现的次数记做{c<sub>1</sub>,c<sub>2</sub>,c<sub>3</sub>,...,c<sub>n</sub>},用p<sub>i</sub>表示每种分类标签出现的比例,<img file="FDA0000113550440000011.GIF" wi="205" he="88" />根据每个分类标签的出现比例,属性分类的熵值公式表示为<img file="FDA0000113550440000012.GIF" wi="397" he="54" />根据统计结果和属性分类的熵值计算公式得到全局熵值,全局熵值为一个向量,对于m个属性分类,用e<sub>tm</sub>表示全局熵值向量中的项,全局熵值向量表示为Et={e<sub>t1</sub>,e<sub>t2</sub>,e<sub>t3</sub>,...,e<sub>tm</sub>};2.4)根据用户、用户浏览记录、商品属性计算用户在每个属性分类上的熵值,用户的熵值计算结果为一个向量,对于m个属性分类,用e<sub>um</sub>表示用户熵值向量中的项,用户熵值向量表示为Eu={e<sub>u1</sub>,e<sub>u2</sub>,e<sub>u3</sub>,...,e<sub>um</sub>},每个进行个性化推荐的用户都有一个用户熵值向量;3)对用户个性化推荐,推荐相似商品,根据当前用户所选商品,与推荐候选集中的结果进行匹配,根据匹配结果和分类熵值权重计算商品的相似度,然后根据相似度进行降序排序完成推荐排序过程:3.1)根据当前用户选择的商品,计算当前用户在属性分类上的熵值,使用步骤2.2)中匹配得到的候选集合商品的属性匹配向量B,再根据2.3)中的全局熵值向量Et和2.4)中的用户熵值向量Eu,计算推荐候选集中每个商品的相似度,再根据相似度对推荐候选集商品进行降序排序,其中,对于推荐候选集中的第k项商品,k=1,2,3,4,5...,相似度sim<sub>k</sub>计算公式为:如果k≤5,sim<sub>k</sub>=B<sub>k</sub>×(Et-Eu)÷k,如果k>5,sim<sub>k</sub>=B<sub>k</sub>×(Et-Eu)÷0.5<sup>k</sup>,根据商品页的推荐数需求对排序后的推荐候选集的推荐数目进行裁剪,得到最终的推荐集合,进行个性化推荐。
地址 210093 江苏省南京市鼓楼区汉口路22号
您可能感兴趣的专利