基于分别设置正负例正确率的可控置信机器算法,申请号CN201510202168.5-传众专利搜索

发明名称	基于分别设置正负例正确率的可控置信机器算法
摘要	本发明适用机器学领域，提供了一种基于分别设置正负例正确率的可控置信机器算法，包括：根据样本训练集训练二元分类器，根据所述二元分类器在所述训练集Train Set上分类，并将分类结果转换成输出值；从原点出发，通过逐步增加预设的等距离步长，计算正例准确率与预设的正准确率比较，得到正例阈值t1，以及，计算负准确率与预设的负准确率比较，得到负例阈值-t2，根据所述正例阈值t1和负例阈值-t2构成的阈值范围(-t2，t1)；根据所述阈值范围对未知样本的分类结果进行分配。本发明提供的技术方案具有控制精度，实现灵活控制的优点。
申请公布号	CN104820839A	申请公布日期	2015.08.05
申请号	CN201510202168.5	申请日期	2015.04.24
申请人	深圳信息职业技术学院	发明人	蒋方纯
分类号	G06K9/62(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构	深圳中一专利商标事务所 44237	代理人	刘朗星
主权项	一种基于分别设置正负例正确率的可控置信机器算法，其特征在于，所述方法包括如下步骤：接收二元训练数据样本和二元训练样本标签构成的训练集Train Set；根据所述训练集Train Set训练二元分类器，得到二元分类器参数值；根据所述二元分类器在所述训练集Train Set上分类，并将分类结果转换成输出值Output score；从原点出发，通过逐步增加预设的等距离步长，计算正例准确率与预设的正准确率比较，得到正例阈值t1，以及，计算负准确率与预设的负准确率比较，得到负例阈值‑t2，根据所述正例阈值t1和负例阈值‑t2构成的阈值范围(‑t2，t1)；获取未知二元样本，根据所述二元分类器对未知二元样本进行分类，并将分类结果转换成输出值Output score；如果所述未知二元样本的输出值Output score属于该阈值范围，将未知样本分配到拒绝域，如未知二元样本的输出值Output Score不属于该阈值范围，将未知样本分配到接受域。
地址	518029 广东省深圳市龙岗区龙翔大道2188号