发明名称 一种基于聚类的移动通信业务用户虚开识别方法
摘要 基于聚类的移动通信业务用户虚开识别方法,属于数据挖掘领域。为了在众多的移动通信业务新发展用户中识别以骗取代理佣金为目的的虚开用户,本发明公开了一种基于聚类的移动通信业务用户虚开识别方法。1.以移动通信业务新发展用户为分析对象,采集新发展用户近期话务结构、消费行为和通话行为的特征;2.经过数据清洗过滤无效的新发展用户;3.利用话务结构和消费行为的关键指标进行甄别,然后针对通话行为进行聚类分析,完成识别虚开用户的建模过程。通过识别虚开用户,可以对新发展用户质量进行监控,规避市场风险。建立新发展用户质量评估体系,为代理商绩效考核以及代理佣金合理标准的制定提供科学依据。
申请公布号 CN101882146A 申请公布日期 2010.11.10
申请号 CN201010174694.2 申请日期 2010.05.18
申请人 北京邮电大学 发明人 郑岩
分类号 G06F17/30(2006.01)I;G06Q10/00(2006.01)I;H04W24/00(2009.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于聚类的移动通信业务用户虚开识别方法,其特征在于,所述方法包括如下步骤:步骤101,数据准备,获取移动通信业务新发展用户近期的通话详单和出帐费用明细数据;步骤102,数据清洗,过滤掉无效的新发展用户;步骤103,话务结构筛选,对于有效的新发展用户根据其话务结构的关键指标进行判别,划分为正常和疑似虚开两类用户,即如果有效的新发展用户的14个话务结构关键指标值均大于当月在网用户平均值的为正常用户,否则为疑似虚开用户,所述话务结构的关键指标包括:月计费总时长、月主叫计费时长、月被叫计费时长、月本地主叫计费时长、月本地被叫计费时长、月长途主叫计费时长、月长途被叫计费时长、月计费总次数、月主叫计费次数、月被叫计费次数、月本地主叫计费次数、月本地被叫计费次数、月长途主叫计费次数和月长途被叫计费次数,共14个;步骤104,消费行为筛选,针对话务结构筛选后判定为疑似虚开的用户,根据其消费行为的关键指标进行判别,划分为正常和疑似虚开两类用户,即日均消费额大于在网用户日均消费额的为正常用户,否则为疑似虚开用户;步骤105,通话行为筛选,针对经话务结构和消费行为筛选均判定为疑似虚开的用户,利用其入网后前100次通话时间间隔进行聚类分析;步骤106,虚开用户锁定,分析聚类结果,确定真正的虚开用户。
地址 100876 北京市海淀区西土城路10号