发明名称 一种基于Boosting的代价敏感软件缺陷预测方法
摘要 本发明公开了一种基于Boosting的代价敏感软件缺陷预测方法,属于软件工程应用的技术领域。本发明使用Bootstrap方式进行重抽样,在属性选择时使用代价敏感的随机删除某个属性的子集选择方式,能够防止对于有价值属性的误删除,同时使得所选择的属性子集有利于减小预测误差代价;在权重更新时使用代价敏感的权重更新机制,对于代价较大的数据集赋予较大权重,能够确保这类数据进行多次的学,得到更为合理的集成预测模型,将该预测模型应用于小样本数据下对软件缺陷进行精确预测,解决了小样本数据下训练数据不足、预测过程中误报和漏报代价不等而导致预测效果不理想的技术问题。
申请公布号 CN106203534A 申请公布日期 2016.12.07
申请号 CN201610594008.4 申请日期 2016.07.26
申请人 南京航空航天大学 发明人 燕雪峰;杨杰;王凯;范亚琼;张晓策;薛参观
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 熊玉玮
主权项 一种基于Boosting的代价敏感软件缺陷预测方法,其特征在于,包括如下步骤:A、对原始数据集进行T次Bootstrap抽样,依据每次抽样的数据集训练预测器,每次抽样后以代价敏感的预测误差为依据删除原始数据集中的属性,整个Bootstrap重抽样过程采用基于代价敏感的机制调整每一次从原始数据集中抽取各实例的权重,T为正整数;B、选取对待预测数据进行缺陷归类的分类阈值;C、采用步骤A获取的T个预测器对待预测数据集进行预测,再结合步骤B选取的分类阈值对待预测数据集进行缺陷归类的划分。
地址 210016 江苏省南京市秦淮区御道街29号