发明名称 一种重复缺陷综合查找方法
摘要 本发明提供的重复缺陷综合查找方法采用关键字查找、描述查找、设备位置及缺陷类型查找三种主要的查找方法,可以全面综合的进行重复缺陷的查找判别,同时以上三种方法均可将查找到的重复缺陷相似度用百分比进行量化,且还能按一定比例,将三种查找方式得到的相似度结合起来得到综合相似度,从而能够客观的评价重复缺陷的相似度。
申请公布号 CN105512299B 申请公布日期 2017.04.26
申请号 CN201510918988.4 申请日期 2015.12.10
申请人 广东蓄能发电有限公司 发明人 贺儒飞;刘阳;钟齐勇;陈杰;李乐卿;罗日平;朱明岗;马勇川;黄星海;蔡鑫贵;张磊;李燚;蔡朝辉;聂航;程诗明;李清燕
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 林丽明
主权项 一种重复缺陷综合查找方法,其特征在于:包括以下步骤:S1.从生产管理数据库中采集所有N条完整缺陷数据的N个部分内容,将所述N个部分内容放入以条为单位的缺陷数据集合Qd中;所述采集是从1至N逐条实现的,即共实现了N次子采集,每次子采集采集1条完整缺陷数据的部分内容,所述1条完整缺陷数据的部分内容仅为重复缺陷综合查找所需的关键字段,所述的所需的关键字段由缺陷单号、描述、位置、缺陷类型和问题代码组成,则缺陷数据集合Qd中存在N条仅分别由缺陷单号、描述、位置、缺陷类型和问题代码组成的缺陷数据;S2.设定作为查找基准的缺陷单号Qn,并在缺陷数据集合Qd中提取出缺陷单号为Qn的缺陷数据Qnd,将缺陷数据Qnd作为基准缺陷数据,1≤n≤N;S3设定p个关键字K1、K2……Kp,2≤p≤5;S4.从基准缺陷数据Qnd中提取出以下关键字段:描述Qndm、位置Qndw、缺陷类型Qndl和问题代码Qndd;S5.从缺陷数据集合Qd中逐条提取除基准缺陷数据Qnd以外的其他缺陷数据与基准缺陷数据Qnd进行比较,从而进行重复缺陷综合查找,其具体过程如步骤S6~步骤S934所述:S6.设置i=1;S7.比较i是否与n相等,如果不等,按顺序进行以下步骤,如果相等跳转到步骤S11;S8.提取缺陷数据集合Qd中的第i条缺陷数据为缺陷数据Qid;S9.从缺陷数据Qid中提取出以下关键字段:描述Qidm、位置Qidw、缺陷类型Qidl、问题代码Qidd;然后分别按描述、关键字、设备位置及缺陷类型进行并行的重复缺陷查找:(1)按描述进行重复缺陷查找:S911.计算描述Qndm的字数Zn;S912.设r=1,描述相似度Xm=100;S913.取描述Qndm的第r位和第r+1位的两个字组成一个二字元词C;S914.比较C是否包含在描述Qidm中,若不包含则Xm=Xm‑(Xm÷(Zn‑1));S915.r=r+1;S916.若r小于Zn,则跳到步骤S913,否则跳到步骤S917;S917.判断Xm是否大于门槛百分比M,大于则将缺陷数据Qid判定为重复缺陷;(2)按关键字进行重复缺陷查找:S921.设s=1,关键字匹配数量q=0,关键字相似度Xg=0;S922.取第s个关键字Ks;S923.比较判断关键字Ks是否包含在描述Qidm中,若包含则令q=q+1,Xg=Xg+100÷p,p为关键字的数量;S924.s=s+1;S925.若s小于等于p,则跳至步骤S922,否则跳至步骤S926;S926.判断关键字相似度Xg是否大于门槛百分比M,q是否大于等于2,如果Xg大于门槛百分比M,或者q大于等于2,则将缺陷数据Qid判定为重复缺陷;(3)按设备位置及缺陷类型进行重复缺陷查找:S931.设置设备位置及缺陷类型相似度Xw=0,比较位置Qidw中根位置以下的其他位置与位置Qndw中根位置以下的其他位置是否相同,相同则Xw=Xw+50;S932.比较缺陷类型Qidl与缺陷类型Qndl是否相同,相同则Xw=Xw+25;S933.比较问题代码Qidd与问题代码Qndd是否相同,相同则Xw=Xw+25;S934.判断Xw是否大于门槛百分比M,大于则将缺陷数据Qid判定为重复缺陷;S10.按以上(1)、(2)、(3)三种方法中的任一种方法判定缺陷数据Qid为重复缺陷,则进行综合相似度Xz计算,否则,跳至步骤S11;Xz=50%×Xm+35%×Xg+15%×Xw;S11判断i是否小于N,若小于N则令i=i+1并返回步骤S7;若i大于等于N则跳至步骤S12;S12.将查找到的重复缺陷按综合相似度从大到小进行排序,然后结束查找。
地址 510635 广东省广州市天河区龙口东路32号