发明名称 以族群有效距离作特征选择之方法与装置
摘要 本发明藉由计算族群有效距离(effective distance between clusters EDC)之方法作为特征选择之依据,本发明之流程包含有,首先输入训练样本之属性向量(或主轴向量),经由EDC依据属性向量(或主轴向量)最小偏差及最大有效辨识距离作特征选择(即重要性排序),完成上述特征重要性排序后,再依据属性向量(或主轴向量)重要性排序逐步降阶,首先输入训练样本之属性向量(或主轴向量),藉由EDC选择之属性向量(或主轴向量)作为辨识向量,输入于决策函数中进行辨识,评估训练过程辨识率是否降低,如果辨识率没有降低,则属性向量(或主轴向量)再降一阶并重新输入训练样本,进行上述降阶评估,如果辨识率降低,则停止属性向量(或主轴向量)降阶,最后可获得最低之有效属性向量数目以减少系统量测时间及计算时间,并且可维持辨识系统精确之辨识率,以提升辨识系统效能与降低成本。
申请公布号 TWI257052 申请公布日期 2006.06.21
申请号 TW093121681 申请日期 2004.07.21
申请人 陈春枝 发明人 连信仲
分类号 G06F17/00 主分类号 G06F17/00
代理机构 代理人
主权项 1.一种以族群有效距离作特征选择之方法(EDC),而 该族群有效距离作特征选择之方法其步骤包含有, 步骤一.分别计算各类别所有特征之中心座标 ,其 中ni是i类别之训练样本数目,xkip是i类别在第p个样 本之第k个特征座标値, 是i类别在第k个特征之中 心座标値, 步骤二.计算各类别之特征标准差ki,该ki是i类 别在第k个特征之标准差,代表特征之离散性,离散 性越大表示不同类别在第k个特征越有可能彼此重 叠,特征重叠性高则相对代表特征相似性高,因此 越不易由此项特征辨识类别, 步骤三.计算所有相对特征在类别间之距离dkij,该 dkij是i类别与j类别在第k个特征之中心距离,其中 ,中心距离越大越可 容忍特征离散性造成系统误判之情形; 步骤四.计算所有相对特征在类别间之有效距离 tkij,其中tkij是指i类别与j类别在第k个特征之有效 距离,亦即是指两个不同类别在第K个特征(PVk或PAVk )之间隔距离(或分级之有效距离),间隔距离越大, 则表示此项特征在不同等级之纱线(或类别)差异 越明显,因此越容易藉由此项特征区别纱线之等级 ; 步骤五.计算所有相对特征在类别间之有效距离最 小者sk,该sk是指对两类别的第k个特征间而言,其相 对具有最少可供辨识之有效距离之値,可视为第K 个特征(属性向量或主轴向量)在类别之第K个特征 中,最少可提供区隔类别之有效距离(或辨识之最 少贡献度),sk=min{tkij}, i≠j; 步骤六.将有效距离最小者取最大値排序,求取特 征之重要性排序指标Rank,Rank=max{sk},k=1,2,…,m,其中m 是类别数目,而Rank是对每一个特征之最少贡献度 做最大値排序,达至可作为特征选择重要性(辨识 分类时最少贡献度)之排序指标; 经由上述流程之组合在EDC进行特征选择时,首先输 入训练样本之属性向量(或主轴向量),经由EDC依据 属性向量(或主轴向量)最小偏差及最大有效辨识 距离作特征选择(即重要性排序),完成上述特征重 要性排序后,再依据属性向量(或主轴向量)重要性 排序逐步降阶,首先输入训练样本之属性向量(或 主轴向量),藉由EDC选择之属性向量(或主轴向量)作 为辨识向量,输入于决策函数中进行辨识,评估训 练过程辨识率是否降低,如果辨识率没有降低,则 属性向量(或主轴向量)再降一阶并重新输入训练 样本,进行上述降阶评估,如果辨识率降低,则停止 属性向量(或主轴向量)降阶,最后可获得最低之有 效属性向量数目以减少系统量测时间及计算时间, 并且可维持辨识系统精确之辨识率,以提升辨识系 统效能与降低成本。 2.一种以族群有效距离作特征选择之装置,其中该 以族群有效距离作特征选择之装置含有, 一学习样本资料库,储存有训练样本之辨识向量( 属性向量或主轴向量); 一个人电脑,该个人电脑内设有学习样本资料库及 该以族群有效距离作特征选择之方法(EDC); 该EDC进行特征选择时,首先藉由该个人电脑输入训 练样本之属性向量(或主轴向量),经由EDC依据属性 向量(或主轴向量)最小偏差及最大有效辨识距离 作特征选择(即重要性排序),完成该特征重要性排 序后,再依据属性向量(或主轴向量)重要性排序逐 步降阶,首先输入训练样本之属性向量(或主轴向 量),藉由EDC选择之属性向量(或主轴向量)作为辨识 向量,输入于决策函数中进行辨识,评估训练过程 辨识率是否降低,如果辨识率没有降低,则属性向 量(或主轴向量)再降一阶并重新输入训练样本,进 行上述降阶评估,如果辨识率降低,则停止属性向 量(或主轴向量)降阶,最后可获得最低之有效属性 向量数目以减少系统量测时间及计算时间,并且可 维持辨识系统精确之辨识率,以提升辨识系统效能 与降低成本。 图式简单说明: 第一图系本发明装置图; 第二图系本发明EDC特征排序方法流程图。
地址 台北市北投区立农街1段35号