发明名称 一种训练流式不平衡数据的方法及设备
摘要 本发明提供一种训练不平衡数据的方法及设备,所述方法通过获取当前流式不平衡数据的第一类别,在所述第二类别的流式不平衡数据的预测值和所述第一类别的当前流式不平衡数据的预测值相差小于预先设置的比较阈值的情况下,通过预先设置的第一算法对目标函数进行求导,获取所述当前流式不平衡数据的权重,根据获取的所述当前流式不平衡数据的权重和预先设置的第二算法获取所述第二类别的流式不平衡数据的权重,从而实现处理不平衡数据,通过非线性的核函数提高非线性数据之间的区分度,并且提高少数类数据的分类准确率,使得模型对于不平衡数据的预测值更加准确。
申请公布号 CN105320677A 申请公布日期 2016.02.10
申请号 CN201410327551.9 申请日期 2014.07.10
申请人 香港中文大学深圳研究院 发明人 杨海钦;胡俊杰;金国庆;吕荣聪
分类号 G06F17/30(2006.01)I;G06K9/66(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳中一专利商标事务所 44237 代理人 张全文
主权项 一种训练流式不平衡数据的方法,其特征在于,所述方法包括:获取当前流式不平衡数据的第一类别;比较预先存储的第二类别的流式不平衡数据的预测值和所述第一类别的当前流式不平衡数据的预测值,所述预测值用于标识预先设置的学习模型预测所述流式不平衡数据的准确度,所述第二类别与所述第一类别相反;在所述第二类别的流式不平衡数据的预测值和所述第一类别的当前流式不平衡数据的预测值相差小于预先设置的比较阈值的情况下,通过预先设置的第一算法对目标函数进行求导,获取所述当前流式不平衡数据的权重;根据获取的所述当前流式不平衡数据的权重和预先设置的第二算法获取所述第二类别的流式不平衡数据的权重。
地址 518000 广东省深圳市南山区虚拟大学园粤兴二道10号香港中文大学深圳研究院大楼