发明名称 基于分别设置正负例正确率的可控置信机器算法
摘要 本发明适用机器学领域,提供了一种基于分别设置正负例正确率的可控置信机器算法,包括:根据样本训练集训练二元分类器,根据所述二元分类器在所述训练集Train Set上分类,并将分类结果转换成输出值;从原点出发,通过逐步增加预设的等距离步长,计算正例准确率与预设的正准确率比较,得到正例阈值t1,以及,计算负准确率与预设的负准确率比较,得到负例阈值-t2,根据所述正例阈值t1和负例阈值-t2构成的阈值范围(-t2,t1);根据所述阈值范围对未知样本的分类结果进行分配。本发明提供的技术方案具有控制精度,实现灵活控制的优点。
申请公布号 CN104820839A 申请公布日期 2015.08.05
申请号 CN201510202168.5 申请日期 2015.04.24
申请人 深圳信息职业技术学院 发明人 蒋方纯
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 深圳中一专利商标事务所 44237 代理人 刘朗星
主权项 一种基于分别设置正负例正确率的可控置信机器算法,其特征在于,所述方法包括如下步骤:接收二元训练数据样本和二元训练样本标签构成的训练集Train Set;根据所述训练集Train Set训练二元分类器,得到二元分类器参数值;根据所述二元分类器在所述训练集Train Set上分类,并将分类结果转换成输出值Output score;从原点出发,通过逐步增加预设的等距离步长,计算正例准确率与预设的正准确率比较,得到正例阈值t1,以及,计算负准确率与预设的负准确率比较,得到负例阈值‑t2,根据所述正例阈值t1和负例阈值‑t2构成的阈值范围(‑t2,t1);获取未知二元样本,根据所述二元分类器对未知二元样本进行分类,并将分类结果转换成输出值Output score;如果所述未知二元样本的输出值Output score属于该阈值范围,将未知样本分配到拒绝域,如未知二元样本的输出值Output Score不属于该阈值范围,将未知样本分配到接受域。
地址 518029 广东省深圳市龙岗区龙翔大道2188号