发明名称 消息分类方法和装置
摘要 本公开是关于一种消息分类方法和装置,属于计算机技术领域。该方法包括:计算每个样本消息的特征值;按照特征值从大到小的顺序遍历,当第一样本消息的第一特征消息中正常样本消息所占比例大于第一预设阈值时,将第一样本消息的特征值作为第一分离阈值;按照特征值从小到大的顺序遍历,当第二样本消息的第二特征消息中垃圾样本消息所占比例大于第二预设阈值时,将第二样本消息的特征值作为第二分离阈值;将特征值大于第一分离阈值且小于第二分离阈值的样本消息作为下一层样本消息,重复执行上述步骤;基于得到的多层的第一分离阈值和第二分离阈值,对接收到的消息进行分类,得到分类结果。本公开提高了分类准确率。
申请公布号 CN104615653A 申请公布日期 2015.05.13
申请号 CN201410850402.0 申请日期 2014.12.30
申请人 小米科技有限责任公司 发明人 秦秋平;龙飞;陈志军
分类号 G06F17/30(2006.01)I;H04W4/14(2009.01)I;H04W12/12(2009.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三高永信知识产权代理有限责任公司 11138 代理人 祝亚男
主权项 一种消息分类方法,其特征在于,所述方法包括:计算每个样本消息的特征值,所述特征值用于表示相应的样本消息是垃圾消息的可能性大小,样本消息包括正常样本消息和垃圾样本消息;按照特征值从大到小的顺序遍历样本消息,对于当前遍历到的第一样本消息,将特征值小于所述第一样本消息的特征值的样本消息作为第一特征消息;当所述第一特征消息中正常样本消息所占的比例大于第一预设阈值时,将所述第一样本消息的特征值作为第一分离阈值,所述第一分离阈值用于划分出正常消息;按照特征值从小到大的顺序遍历样本消息,对于当前遍历到的第二样本消息,将特征值大于所述第二样本消息的特征值的样本消息作为第二特征消息;当所述第二特征消息中垃圾样本消息所占的比例大于第二预设阈值时,将所述第二样本消息的特征值作为第二分离阈值,所述第二分离阈值用于划分出垃圾消息;将特征值大于所述第一分离阈值且小于所述第二分离阈值的样本消息作为下一层样本消息,对下一层样本消息重复执行上述确定第一分离阈值和第二分离阈值的步骤,得到下一层的第一分离阈值和第二分离阈值,直至特征值大于当前层的第一分离阈值且小于当前层的第二分离阈值的样本消息的数目小于预设数目时停止,得到多层的第一分离阈值和第二分离阈值;基于所述多层的第一分离阈值和第二分离阈值,对接收到的消息进行分类,得到分类结果。
地址 100085 北京市海淀区清河中街68号华润五彩城购物中心二期13层
您可能感兴趣的专利