发明名称 |
一种骚扰号码的识别方法 |
摘要 |
一种骚扰号码的识别方法,包括有:选取若干已确认的骚扰和非骚扰号码,计算所述骚扰和非骚扰号码在一段时间内的通信行为指标,然后将所述骚扰和非骚扰号码及其通信行为指标形成训练样本集来构建随机森林分类模型,所述随机森林分类模型的输入是每个用户号码的通信行为指标,输出是所有决策树判定其为骚扰号码和非骚扰号码的预测概率;将待识别号码在一段时间内的通信行为指标输入随机森林分类模型,并计算随机森林分类模型中所有决策树判定其为骚扰号码和非骚扰号码的预测概率,以据此来判定所述待识别号码是否是骚扰号码。本发明属于网络通信技术领域,能充分利用主、被叫号码的呼叫特征,从现网的海量话务数据中有效识别骚扰号码。 |
申请公布号 |
CN106255116A |
申请公布日期 |
2016.12.21 |
申请号 |
CN201610710545.0 |
申请日期 |
2016.08.24 |
申请人 |
王瀚辰;王彦青 |
发明人 |
王瀚辰;王彦青 |
分类号 |
H04W12/12(2009.01)I;H04M3/22(2006.01)I |
主分类号 |
H04W12/12(2009.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种骚扰号码的识别方法,其特征在于,包括有:步骤一、选取若干已确认的骚扰和非骚扰号码,计算所述骚扰和非骚扰号码在一段时间内的通信行为指标,然后将所述骚扰和非骚扰号码及其通信行为指标形成训练样本集来构建随机森林分类模型,所述随机森林分类模型的输入是每个用户号码的通信行为指标,输出是所有决策树判定其为骚扰号码和非骚扰号码的预测概率;步骤二、将待识别号码在一段时间内的通信行为指标输入随机森林分类模型,并计算随机森林分类模型中所有决策树判定其为骚扰号码和非骚扰号码的预测概率,以据此来判定所述待识别号码是否是骚扰号码。 |
地址 |
100096 北京市海淀区西三旗育新花园39#401 |