发明名称 |
基于分别设置正负例正确率的可控置信机器算法 |
摘要 |
本发明适用机器学领域,提供了一种基于分别设置正负例正确率的可控置信机器算法,包括:根据样本训练集训练二元分类器,根据所述二元分类器在所述训练集Train Set上分类,并将分类结果转换成输出值;从原点出发,通过逐步增加预设的等距离步长,计算正例准确率与预设的正准确率比较,得到正例阈值t1,以及,计算负准确率与预设的负准确率比较,得到负例阈值-t2,根据所述正例阈值t1和负例阈值-t2构成的阈值范围(-t2,t1);根据所述阈值范围对未知样本的分类结果进行分配。本发明提供的技术方案具有控制精度,实现灵活控制的优点。 |
申请公布号 |
CN104820839A |
申请公布日期 |
2015.08.05 |
申请号 |
CN201510202168.5 |
申请日期 |
2015.04.24 |
申请人 |
深圳信息职业技术学院 |
发明人 |
蒋方纯 |
分类号 |
G06K9/62(2006.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
深圳中一专利商标事务所 44237 |
代理人 |
刘朗星 |
主权项 |
一种基于分别设置正负例正确率的可控置信机器算法,其特征在于,所述方法包括如下步骤:接收二元训练数据样本和二元训练样本标签构成的训练集Train Set;根据所述训练集Train Set训练二元分类器,得到二元分类器参数值;根据所述二元分类器在所述训练集Train Set上分类,并将分类结果转换成输出值Output score;从原点出发,通过逐步增加预设的等距离步长,计算正例准确率与预设的正准确率比较,得到正例阈值t1,以及,计算负准确率与预设的负准确率比较,得到负例阈值‑t2,根据所述正例阈值t1和负例阈值‑t2构成的阈值范围(‑t2,t1);获取未知二元样本,根据所述二元分类器对未知二元样本进行分类,并将分类结果转换成输出值Output score;如果所述未知二元样本的输出值Output score属于该阈值范围,将未知样本分配到拒绝域,如未知二元样本的输出值Output Score不属于该阈值范围,将未知样本分配到接受域。 |
地址 |
518029 广东省深圳市龙岗区龙翔大道2188号 |