发明名称 基于半监督学的推荐系统托攻击检测方法
摘要 本发明公开了一种基于半监督学的推荐系统托攻击检测方法,包括以下阶段:托攻击检测预处理阶段;通过对标记数据集和未标记数据集的数据进行预处理,获得标记和未标记数据集的托攻击检测指标,然后在标记数据集上训练初始的朴素贝叶斯分类器;EM-λ算法阶段;通过EM-λ算法不断迭代获取一个稳定的分类器,最终得到未标记数据集的类型;通过函数f:U→C来预测未标记用户属于正常用户normal(N)还是托攻击用户shilling(S),完成推荐系统托攻击检测。本发明用于发现推荐系统中的托攻击用户,具有高效性、灵敏性和特效性,具有高检测率和低错误率。
申请公布号 CN102184364A 申请公布日期 2011.09.14
申请号 CN201110138421.7 申请日期 2011.05.26
申请人 南京财经大学 发明人 伍之昂;曹杰;王有权;毛波
分类号 G06F21/00(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F21/00(2006.01)I
代理机构 南京汇盛专利商标事务所(普通合伙) 32238 代理人 陈扬
主权项 一种基于半监督学习的推荐系统托攻击检测方法,其特征在于该方法包括以下阶段:1)托攻击检测预处理阶段;该阶段通过对标记数据集和未标记数据集的数据进行预处理,获得标记和未标记数据集的托攻击检测指标,然后在标记数据集上训练初始的朴素贝叶斯分类器;如果用户的类别已知,则其属于标记数据集L,否则属于未标记数据集U;L={(u1,c1),(u2,c2),…,(u|L|,c|L|)}为标记数据集, (u1, u2, ,…, u|L|)表示用户集合,(c1, c2, ,…, c|L|)表示该用户的类型集合,而U={u’1, u’2,…, u’|U|}为未标记数据集;2)EM‑λ算法阶段;该阶段通过EM‑λ算法不断迭代获取一个稳定的分类器,最终得到未标记数据集的类型;通过函数f: U→C来预测未标记用户属于正常用户normal(N)还是托攻击用户shilling(S),完成推荐系统托攻击检测。
地址 210003 江苏省南京市铁路北街128号