发明名称 一种基于高斯估计的在线餐饮主标签数据快速提取方法
摘要 一种基于高斯估计的在线餐饮主标签数据快速提取方法,包括以下步骤:1)获取商铺标签数据,以及用户评分与评论数据,并对商铺标签数据进行预处理;2)针对每个用户,将其各标签的评分数据集求得高斯分布的平均值与方差,即该用户在该标签下的评分高斯分布;3)针对每个用户,将每次商铺的各个标签评分与该标签评分高斯分布作标准化处理,求得最大似然估计作为该次用户去该商铺的目标标签;4)将估计标签、实际完整标签分别和评论数据作测试,取两者匹配率的相对偏差作为模型的最终评价成绩。本发明提取高斯分布下最大似然口味标签作为用户就餐行为的主选口味标签,提取精度较高且算法复杂度较低,适合实际应用场景。
申请公布号 CN106250522A 申请公布日期 2016.12.21
申请号 CN201610634284.9 申请日期 2016.08.03
申请人 浙江工业大学 发明人 宣琦;周鸣鸣;张致远;傅晨波;翔云;吴哲夫
分类号 G06F17/30(2006.01)I;G06Q30/02(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州斯可睿专利事务所有限公司 33241 代理人 王利强
主权项 一种基于高斯估计的在线餐饮主标签数据快速提取方法,其特征在于:所述提取方法包括以下步骤:S1:获取商铺标签数据,以及用户评分与评论数据,对商铺标签数据进行预处理,删除共同标签和无效标签;S2:针对每个用户,将其各标签的评分数据集求得高斯分布的平均值与方差,即该用户在该标签下的评分高斯分布;S3:针对每个用户,将每次商铺的各个标签评分与该标签评分高斯分布作标准化处理,求得最大似然估计作为该次用户去该商铺的目标标签;S4:将上述估计标签、实际完整标签分别和评论数据作测试,取两者匹配率的相对偏差作为模型的最终评价成绩。
地址 310014 浙江省杭州市下城区潮王路18号浙江工业大学