发明名称 一种大数据的电费风险模型构建方法
摘要 一种大数据的电费风险模型构建方法,涉及一种风险管控方法。目前,电费的催缴是按统一频率和统一方式进行;一方面存在催缴次数、频率过多问题,另一方面存在缴费不能完成目标的问题。本发明包括以下步骤:一)数据准备、二)指标体系构建、三)相关性分析、四)模型构建、五)模型输出、六)电费风险差异处理。本技术方案聚焦高风险用户,提升催费的针对性。针对低风险用户,可以适当减少提醒、通知环节,降低催费频率,优先推广电子账单;重点针对高风险用户开展催收工作,提升催费的频率;有效地优化并集中资源,提高催收的成功率。
申请公布号 CN106251049A 申请公布日期 2016.12.21
申请号 CN201610587762.5 申请日期 2016.07.25
申请人 国网浙江省电力公司宁波供电公司;国家电网公司;国网浙江省电力公司 发明人 罗飞鹏;涂莹;欧阳柳;林森;金慧颂;周斌;马德荣;王庆娟;龙正雄;王海波;柯方圆;卢姗姗;孔旭锋;林士勇;吴亮
分类号 G06Q10/06(2012.01)I;G06Q50/06(2012.01)I 主分类号 G06Q10/06(2012.01)I
代理机构 浙江翔隆专利事务所(普通合伙) 33206 代理人 王晓燕
主权项 一种大数据的电费风险模型构建方法,其特征在于包括以下步骤:一)数据准备:1)数据获取:根据国网内部的营销系统数据、用电采集系统数据,收集客户基础信息、交费信息、违约信息、违法信息、用电趋势信息;根据外部系统数据,收集外部信用信息、行业前景信息评价、生产经营信息数据;2)数据检验:对获取的数据进行检验,包括:A、用户ID的是唯一性,检验每个 ID 变量是否仅出现一次,若出现多次,则核查原因并调整数据;B、范围和取值:检验每个变量是否为一个定义清晰、具有已知的或预期取值范围的字段,当数据为连续变量时,其值在设定预期范围内,当数据为名义变量时,其为维表中的值;C、缺失值:检验每个字段是否存在缺失值及其来源是否完整,若出现缺失值,则分析缺失值出现的原因,并根据原因,对缺失值进行处理;D、异常值:检验数据是否偏离数据集的观测值,当偏离数据集的观测值时认为该数据为异常值,检验异常值出现的原因,并相应的处理异常值;3)数据处理:数据处理包括对缺失值、离群值、异常值的记录进行清洗以相关衍生变量的生成;二)指标体系构建:以用电客户数据为样本;分析有欠费记录客户的各维度数据信息,提取诸多与欠费风险可能相关的变量;变量包括:产生违约金次数、平均回款时长、月末缴费次数、逾期交费率、是否存在连续逾期、逾期时长、业务变更次数、应收电费金额是否平稳;三)相关性分析:对变量,包括原始变量和衍生变量,进行相关性分析,衡量变量间的相关性;当相关系数大于设定值时,认为两个变量高度相关,则删除其中一变量;对单变量进行分析,包括解释变量和被解释变量之间的关联分析和卡方分析;四)模型构建:根据变量产生违约金次数、平均回款时长、月末缴费次数、逾期交费率、是否存在连续逾期、逾期时长、业务变更次数、应收电费金额是否平稳,对高压客户、低压非居客户、居民客户进行对应的电费风险建模,并根据模型计算电费风险发生的概率;五)模型输出:1)用电客户风险等级分类:根据构建的模型计算电费风险发生的概率,根据客户欠费状态,将用电客户风险等级划分为潜在风险和事实风险两类:A、潜在风险:在模型运算时已结清电费,同时依据电费风险评估模型输出的用电客户评估结果,分为潜在高风险、潜在中风险和潜在低风险三个等级;B)事实风险:模型运算时尚未结清或仍有垫付记录,依据电费风险评估模型输出的风险等级,分为事实高风险、事实中风险和事实低风险三个等级;2)用电客户风险趋势分析:记录各个考察时期的风险变动方向,以全面地动态反映客户的交费状况:六)电费风险差异处理:根据模型输出结果,提前采取差异化的电费回收策略和预防措施,缩短电费回收周期,控制经营风险,针对低风险用户,减少提醒、通知环节,降低催费频率,优先推广电子账单;对高风险用户开展催收工作,提升催费的频率。
地址 315099 浙江省宁波市望京路483号