发明名称 |
一种提纯贝叶斯负样本的方法、系统及装置 |
摘要 |
本发明公开了一种提纯贝叶斯负样本的方法、系统及装置,用以解决目前无法自动调节贝叶斯负样本学库中负样本数量与贝叶斯正样本学库中正样本数量比例失衡的问题。本发明方法包括步骤:当前网络信息被判定为负样本后,归入对应的负样本类别,并统计当前该类别中的负样本数量;若所述当前网络信息归属的类别中的负样本数量不大于预设的阈值,则将所述当前网络信息中的内容录入贝叶斯负样本学库,否则,对所述当前网络信息不做处理。 |
申请公布号 |
CN1987909A |
申请公布日期 |
2007.06.27 |
申请号 |
CN200510131988.6 |
申请日期 |
2005.12.22 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
周颢 |
分类号 |
G06Q10/00(2006.01);G06F17/30(2006.01);G06N7/00(2006.01) |
主分类号 |
G06Q10/00(2006.01) |
代理机构 |
北京同达信恒知识产权代理有限公司 |
代理人 |
黄志华 |
主权项 |
1、一种提纯贝叶斯负样本的方法,其特征在于,包括下列步骤:当前网络信息被判定为负样本后,归入对应的负样本类别,并统计当前该类别中的负样本数量;若当前网络信息归属的类别中的负样本数量不大于预设的阈值,则将当前网络信息中的内容录入贝叶斯负样本学习库,否则,对当前网络信息不做处理。 |
地址 |
518044广东省深圳市福田区振兴路赛格科技园2栋东410室 |