主权项 |
一种基于工业以太网故障诊断方法中决策树的创建方法,其特征在于:所述的决策树包括决策属性节点、属性值分枝和叶节点,决策属性节点是进行分类的决策属性的集合,属性值分枝是按照决策属性进一步划分的取值特性的属性值的集合,叶节点是决策或分类结果的集合;决策树的创建方法包括以下步骤:A:首先,根据用户的实际需要选择类别标识属性和决策树的决策属性集,类别标识属性是指根据用户实际需要选取的某一特定属性,决策属性集是指在除了类别标识属性之外的所有属性中选择的属性集;B:根据贪心算法构造决策树,贪心算法指以自顶向下递归规律,各个击破的方式,贪心算法步骤如下:B1:树从代表训练样本的单个节点开始;B2:如果训练样本均在同一个类,则该节点成为叶节点,并用该类标记,否则,选择最有分类能力的属性节点作为决策树的当前叶节点;B3:根据当前节点属性取值的不同,将训练样本数据集划分为若干子集,每个取值形成一个分枝;B4:针对步骤B3得到的一个子集,重复进行步骤B3,递归形成每个划分样本上的决策树;B5:递归划分步骤当且仅当下列条件之一成立时停止:(1)给定节点的所有样本属于同一类;(2)没有剩余属性可以用来进一步划分样本;在这种情况下,使用多数表决,将给定的节点转换成树叶,并以样本中元组个数最多的类别作为类别标记,同时也可以存放该节点样本的类别分布;(3)如果某一分枝没有样本,则以样本的多数类创建一个叶节点;C:当步骤B中的决策树构造完毕后,需要对构造完成的决策树进行校验、修正;C1:使用新的训练样本数据集中的数据校验构造完成的决策树产生的初步规则;C2:将影响预测准确性的分枝剪除,修正完毕。 |