发明名称 垃圾短消息的分类方法
摘要 本发明提出了一种垃圾短消息的分类方法,能够应用支持矢量机(SVM)和人工神经网络(ANN)对自学,并通过有效算法SVM分类器和ANN分类器这两种分类器有机的结合起来。该算法为:将分类样本发送到人工神经网络分类器,并将人工神经网络分类器的输出值M进行排序;如果输出值M的最大值大于预设定值r,则该最大值对应的分类即为该短消息的分类,否则所述输出值M是否小于等于预定值s,如果是则将该分类样本归入拒识类;如果M在r和s之间则利用先前的训练结果再使用支持矢量机分类器进行分类。本发明能够在容许的拒识率下,对垃圾短信的分类效果更好。
申请公布号 CN101516071A 申请公布日期 2009.08.26
申请号 CN200810069369.2 申请日期 2008.02.18
申请人 中国移动通信集团重庆有限公司 发明人 秦大斌;刘瑛;杜燕春;谢志远;袁锐;刘建胜;唐兵;何蔓微;佘安娅
分类号 H04W4/14(2009.01)I;H04W12/12(2009.01)I;G06N3/063(2006.01)I;G06F17/30(2006.01)I 主分类号 H04W4/14(2009.01)I
代理机构 重庆志合专利事务所 代理人 胡荣珲
主权项 1、一种垃圾短消息的分类方法,包括:步骤1、根据垃圾短信息的原始特征生成特征向量,所述原始特征至少包括垃圾短信息的关键词;步骤2、将所述特征向量作为输入向量,输入人工神经网络进行训练,得到训练结果1;将所述特征向量作为输入向量,输入支持矢量机进行训练,得到训练结果2;将所述特征向量作为输入向量,输入人工神经网络进行分类,得到分类结果,并将该分类结果输入人工神经网络进行训练,得到训练结果3;步骤3、将分类样本发送到人工神经网络分类器,并将人工神经网络分类器的输出值M进行排序;如果输出值M的最大值大于预设定值r,则该最大值对应的分类即为该短消息的分类,步骤结束;如果输入值M的最大值不大于预设定值r,则进入步骤4;步骤4、判断所述输出值M是否小于等于预定值s,如果是则将该分类样本归入拒识类,步骤结束;否则进入步骤5;步骤5、将分类样本分别发送到生成训练结果2和生成训练结果3的支持矢量机分类器进行分类,如果两分类器的结果一致,则该分类结果即为该分类样本对应的类别,否则将该分类样本归入拒识类,步骤结束。
地址 401121重庆市渝北区星光三路2号