发明名称 |
商品评论信息中重复信息处理方法 |
摘要 |
本发明提供了一种商品评论信息中重复信息处理方法,其包括:S1:从商品评论信息中选取第一评论信息和第二评论信息;S2:从第一评论信息和第二评论信息中选择相同的关键词,并计算每个关键词在第一评论信息中出现的第一次数以及每个关键词在第二评论信息中出现的第二次数;S3:比较每个关键词的第一次数和第二次数,并计算每个关键词的第一次数和第二次数之间的差值;S4:如果第一次数大于第二次数,且差值在预设阈值内,则保留第一评论信息并隐藏第二评论信息;如果第一次数小于第二次数,且差值在预设阈值内,则保留第二评论信息并隐藏第一评论信息,本发明能够识别并处理重复的评论信息。 |
申请公布号 |
CN105488144A |
申请公布日期 |
2016.04.13 |
申请号 |
CN201510836742.2 |
申请日期 |
2015.11.25 |
申请人 |
四川诚品电子商务有限公司 |
发明人 |
黄正强 |
分类号 |
G06F17/30(2006.01)I;G06Q30/06(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
成都华风专利事务所(普通合伙) 51223 |
代理人 |
徐丰 |
主权项 |
一种商品评论信息中重复信息处理方法,其特征在于,包括:S1:从商品评论信息中选取第一评论信息和第二评论信息;S2:从所述第一评论信息和第二评论信息中选择相同的关键词,并计算所述每个关键词在所述第一评论信息中出现的第一次数以及所述每个关键词在所述第二评论信息中出现的第二次数;S3:比较所述每个关键词的第一次数和第二次数,并计算所述每个关键词的第一次数和第二次数之间的差值;S4:如果所述第一次数大于第二次数,且所述差值在预设阈值内,则保留所述第一评论信息并隐藏所述第二评论信息;如果所述第一次数小于第二次数,且所述差值在预设阈值内,则保留所述第二评论信息并所述隐藏第一评论信息。 |
地址 |
610000 四川省成都市武侯区人民南路四段53号甲幢14楼C号 |