发明名称 一种电气火灾熔痕物证的自动鉴定方法
摘要 本发明公开了一种电气火灾熔痕物证的自动鉴定方法,包括以下步骤:1)金相图片预处理;2)图像特征提取;3)图像判定和识别。本发明基于支持向量机的电气火灾物证的金相图片识别和判断,确定电气火灾熔痕的性质,为火灾调查提供科学而有效的调查信息,避免了传统的人为经验的判断,可以使以后的火灾熔痕判断更加客观有效地进行。
申请公布号 CN104156963B 申请公布日期 2017.02.15
申请号 CN201410395742.9 申请日期 2014.08.12
申请人 中山大学 发明人 王莉;梁栋;吴泽鑫;莫善军;余圣辉
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 广州市华学知识产权代理有限公司 44245 代理人 黄磊
主权项 一种电气火灾熔痕物证的自动鉴定方法,其特征在于,包括以下步骤:1)金相图片预处理1.1)图像灰度化彩色图像中每个像素点由R、G、B三个分量决定,每个分量有255个值,这样一个像素点有255×255×255个值可选,而灰度图是R、G、B三个分量是相同值的一种特殊彩色图片,所以每个像素点的可选值是255个;根据YUV的颜色空间,Y分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应:Y=0.3R+0.59G+0.11B,最后以这个亮度值表达图像的灰度值;1.2)图像的直方图处理对于一幅灰度图像,在[0,Y]内总共有L个灰度级,z<sub>i</sub>是区间[0,Y]内的第i级亮度的灰度值,n<sub>i</sub>表示灰度为z<sub>i</sub>的图像中的像素数,n是图像中所有的像素总数,这样图像中灰度为z<sub>i</sub>的像素出现概率是<img file="FDA0001132255380000011.GIF" wi="448" he="119" />这个式子表达某亮度其灰度级为z<sub>i</sub>出现的频数,p实际上是一个数字图像的直方图,将灰度级归一化到[0,1]的离散量;1.3)直方图的均衡化通过扩展输入图像的灰度级到较宽亮度范围的方式来实现图像增强,若P<sub>r</sub>(r)表示原图像的PDF,用P<sub>s</sub>(s)表示均衡化后图像的PDF,r,s分别表示均衡变化前后的灰度值,r,s属于[0,1],根据概率知识:<img file="FDA0001132255380000012.GIF" wi="542" he="327" />公式中T<sup>‑1</sup>(S)代表T(r)的逆变换函数,因为要求的概率密度为1,即<img file="FDA0001132255380000021.GIF" wi="391" he="157" />因此:<img file="FDA0001132255380000022.GIF" wi="246" he="127" />进一步得出:ds=p<sub>r</sub>(r)·dr,等式两边对r积分,即可得到PDF的均衡化公式:<img file="FDA0001132255380000023.GIF" wi="443" he="136" />公式中T(r)代表r的灰度变换函数,∫表示积分,w为假设变量,对于离散型灰度级表示为:<img file="FDA0001132255380000024.GIF" wi="630" he="150" />图像经过直方图归一处理后,直方图的各值是图像取各灰度级的概率,对于离散的灰度级,其均衡化变换后图像中的亮度值为:<maths num="0001"><math><![CDATA[<mrow><mi>S</mi><mrow><mo>(</mo><msub><mi>z</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>0</mn></mrow><mi>i</mi></munderover><msub><mi>P</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>z</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mn>...</mn><mi>L</mi><mo>;</mo></mrow>]]></math><img file="FDA0001132255380000025.GIF" wi="686" he="150" /></maths>1.4)顶帽变换从原有的图像中减去开运算后的图像;2)图像特征提取包括均值,即平均亮度的度量;标准偏差,即平均对比度的度量;平滑度,即区域中亮度的相对平滑度度量;三阶矩,即度量直方图的倾斜;一致性,即度量一致性,当所有灰度值相等时,该度量值最大且从此处开始减小;熵,即随机性的度量;HOG描述子,即计算局部图像梯度的方向信息的统计值;3)图像判定和识别3.1)在提取金相图片的相关特征后,组成一个有标识的训练样本集,{(X<sub>i</sub>,y<sub>i</sub>)|X<sub>i</sub>∈R<sup>n</sup>,y<sub>i</sub>∈{‑1,1},i=1,...,N},其中X<sub>i</sub>=(x<sub>i1</sub>,x<sub>i2</sub>,…,x<sub>i9</sub>)对应第i个样本的属性集,也就是特征集,y<sub>i</sub>是它的标识号,其值不是‑1就是1,这样就是一个包含N个训练样本的二元分类;3.2)低维度到高维度的转化基于低维度线性不可分,将低维度转化到高维度,从而实现决策边界在新高维空间是线性,选择多项式核函数K(x,y)=(x·y+1)<sup>p</sup>,设g(x)是一个具有有限L<sub>2</sub>范数的函数,即∫g(x)<sup>2</sup>dx<∞,则:<maths num="0002"><math><![CDATA[<mfenced open = "" close = ""><mtable><mtr><mtd><mrow><mo>&Integral;</mo><msup><mrow><mo>(</mo><mi>x</mi><mo>&CenterDot;</mo><mi>y</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mi>p</mi></msup><mi>g</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>g</mi><mrow><mo>(</mo><mi>y</mi><mo>)</mo></mrow><mi>d</mi><mi>x</mi><mi>d</mi><mi>y</mi></mrow></mtd></mtr><mtr><mtd><mrow><mo>=</mo><mo>&Integral;</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>p</mi></munderover><mfenced open = "(" close = ")"><mtable><mtr><mtd><mi>p</mi></mtd></mtr><mtr><mtd><mi>i</mi></mtd></mtr></mtable></mfenced><msup><mrow><mo>(</mo><mi>x</mi><mo>&CenterDot;</mo><mi>y</mi><mo>)</mo></mrow><mi>i</mi></msup><mi>g</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>g</mi><mrow><mo>(</mo><mi>y</mi><mo>)</mo></mrow><mi>d</mi><mi>x</mi><mi>d</mi><mi>y</mi></mrow></mtd></mtr><mtr><mtd><mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>p</mi></munderover><mfenced open = "(" close = ")"><mtable><mtr><mtd><mi>p</mi></mtd></mtr><mtr><mtd><mi>i</mi></mtd></mtr></mtable></mfenced><mo>&Integral;</mo><munder><mo>&Sigma;</mo><mrow><msub><mi>&alpha;</mi><mn>1</mn></msub><mo>,</mo><msub><mi>&alpha;</mi><mn>2</mn></msub><mo>,</mo><mn>...</mn></mrow></munder><mfenced open = "(" close = ")"><mtable><mtr><mtd><mrow></mrow></mtd><mtd><mi>i</mi></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><msub><mi>&alpha;</mi><mn>1</mn></msub></mtd><mtd><msub><mi>&alpha;</mi><mn>2</mn></msub></mtd><mtd><mn>...</mn></mtd></mtr></mtable></mfenced><mo>&lsqb;</mo><mtable><mtr><mtd><msup><mrow><mo>(</mo><msub><mi>x</mi><mn>1</mn></msub><msub><mi>y</mi><mn>1</mn></msub><mo>)</mo></mrow><msub><mi>&alpha;</mi><mn>1</mn></msub></msup></mtd><mtd><msup><mrow><mo>(</mo><msub><mi>x</mi><mn>2</mn></msub><msub><mi>y</mi><mn>2</mn></msub><mo>)</mo></mrow><msub><mi>&alpha;</mi><mn>2</mn></msub></msup></mtd><mtd><msup><mrow><mo>(</mo><msub><mi>x</mi><mn>3</mn></msub><msub><mi>y</mi><mn>3</mn></msub><mo>)</mo></mrow><msub><mi>&alpha;</mi><mn>3</mn></msub></msup></mtd><mtd><mn>...</mn></mtd></mtr></mtable><mo>&rsqb;</mo><mi>g</mi><mrow><mo>(</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><msub><mi>x</mi><mn>2</mn></msub><mo>,</mo><mn>...</mn><mo>)</mo></mrow><mi>g</mi><mrow><mo>(</mo><msub><mi>y</mi><mn>1</mn></msub><mo>,</mo><msub><mi>y</mi><mn>2</mn></msub><mo>,</mo><mn>...</mn><mo>)</mo></mrow><msub><mi>dx</mi><mn>1</mn></msub><msub><mi>dx</mi><mn>2</mn></msub><mn>...</mn><msub><mi>dy</mi><mn>1</mn></msub><msub><mi>dy</mi><mn>2</mn></msub><mn>...</mn></mrow></mtd></mtr><mtr><mtd><mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>p</mi></munderover><munder><mo>&Sigma;</mo><mrow><msub><mi>&alpha;</mi><mn>1</mn></msub><mo>,</mo><msub><mi>&alpha;</mi><mn>2</mn></msub><mo>,</mo><mn>...</mn></mrow></munder><mfenced open = "(" close = ")"><mtable><mtr><mtd><mi>p</mi></mtd></mtr><mtr><mtd><mi>i</mi></mtd></mtr></mtable></mfenced><mfenced open = "(" close = ")"><mtable><mtr><mtd><mrow></mrow></mtd><mtd><mi>i</mi></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><msub><mi>&alpha;</mi><mn>1</mn></msub></mtd><mtd><msub><mi>&alpha;</mi><mn>2</mn></msub></mtd><mtd><mn>...</mn></mtd></mtr></mtable></mfenced><msup><mrow><mo>&lsqb;</mo><mo>&Integral;</mo><msubsup><mi>x</mi><mn>1</mn><msub><mi>&alpha;</mi><mn>1</mn></msub></msubsup><msubsup><mi>x</mi><mn>2</mn><msub><mi>&alpha;</mi><mn>2</mn></msub></msubsup><mn>...</mn><mi>g</mi><mrow><mo>(</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><msub><mi>x</mi><mn>2</mn></msub><mo>,</mo><mn>...</mn><mo>)</mo></mrow><msub><mi>dx</mi><mn>1</mn></msub><msub><mi>dx</mi><mn>2</mn></msub><mn>...</mn><mo>&rsqb;</mo></mrow><mn>2</mn></msup><mo>&GreaterEqual;</mo><mn>0</mn></mrow></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0001132255380000031.GIF" wi="1955" he="543" /></maths>积分结果非负,因此所选核函数满足Mercer定理;Mercer原理确保核函数在低维空间中的计算用高维空间中两个向量点积表示,又由于核函数是原属性空间中的相似度函数,故存在:K(x,y)=Φ(x)·Φ(y)=(x·y+1)<sup>p</sup>,将原来的特征空间映射到一个新的高维空间,其属性集成为Φ(x),决策边界在这个空间为线性;3.3)假设决策边界函数在高维空间内,假设一个线性决策边界函数表达为:f(x)=w·Φ(x)+b,其中,w和b是模型的参数,且任何位于决策边界上的样本都必须满足w·Φ(x)+b=0;3.4)定义决策边界边缘考虑那些距离决策边界最近的数据,某些位于决策边界一边的数据,则存在关系:w·X<sub>s</sub>+b≥0,位于决策边界另一边的数据,满足关系:w·X<sub>x</sub>+b≤0,调整w和b,两个平行的超平面b<sub>i1</sub>和b<sub>i2</sub>表示为:b<sub>i1</sub>:w·X+b=1b<sub>i2</sub>:w·X+b=‑1决策边界的边缘由这两个超平面之间的距离给出,令X<sub>1</sub>是b<sub>i1</sub>上的一个数据点,X<sub>2</sub>是b<sub>i2</sub>上的一个数据点,分别带入上两式,两式再相减得:w·(X<sub>1</sub>‑X<sub>2</sub>)=2,令X<sub>1</sub>‑X<sub>2</sub>=d,所以:<img file="FDA0001132255380000041.GIF" wi="182" he="150" />3.5)估算参数w和b,确定决策边界在高维可分情况下,依据已有训练集和决策边界边缘的定义,估算边界函数的参数w和b,选择的参数必须满足下面的两个条件:如果y<sub>i</sub>=1,则w·X<sub>i</sub>+b≥1,如果y<sub>i</sub>=‑1,则w·X<sub>i</sub>+b≤‑1,将两个不等式概括为:y<sub>i</sub>(w·X<sub>i</sub>+b)≥1,i=1,2,…,N,要求决策边界的边缘必须是最大的条件下,<img file="FDA0001132255380000042.GIF" wi="161" he="134" />最大,等价为求目标函数:<img file="FDA0001132255380000043.GIF" wi="262" he="134" />的最小值,也就是进一步概括等价形式为:<img file="FDA0001132255380000044.GIF" wi="215" he="150" />且受限于y<sub>i</sub>(w·X<sub>i</sub>+b)≥1,i=1,2,…,N,这是一个凸优化问题,通过拉格朗日乘子的方法进行求解:在考虑加在解上面的约束,将目标函数改写为拉格朗日函数:<img file="FDA0001132255380000045.GIF" wi="766" he="142" />其中,η<sub>i</sub>是拉格朗日乘子,拉格朗日函数将目标函数和不等式约束进行组合,将问题变为求解不违反不等式约束条件的可行解,按照一般求函数最小值的办法,拉格朗日函数对w和b求导后等于0,得到w和b的值:<maths num="0003"><math><![CDATA[<mrow><mfrac><mrow><mo>&part;</mo><msub><mi>L</mi><mi>P</mi></msub></mrow><mrow><mo>&part;</mo><mi>w</mi></mrow></mfrac><mo>=</mo><mn>0</mn><mo>&DoubleRightArrow;</mo><mi>w</mi><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>&eta;</mi><mi>i</mi></msub><msub><mi>y</mi><mi>i</mi></msub><msub><mi>X</mi><mi>i</mi></msub></mrow>]]></math><img file="FDA0001132255380000046.GIF" wi="590" he="150" /></maths><maths num="0004"><math><![CDATA[<mrow><mfrac><mrow><mo>&part;</mo><msub><mi>L</mi><mi>P</mi></msub></mrow><mrow><mo>&part;</mo><mi>b</mi></mrow></mfrac><mo>=</mo><mn>0</mn><mo>&DoubleRightArrow;</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>&eta;</mi><mi>i</mi></msub><msub><mi>y</mi><mi>i</mi></msub><mo>=</mo><mn>0</mn></mrow>]]></math><img file="FDA0001132255380000047.GIF" wi="526" he="151" /></maths>由于η<sub>i</sub>拉格朗日乘子未知,等式个数少于未知数个数,无法求解,所以为了求出w和b的值,将上面的不等式约束变换为等式约束,这种变换在KKT条件下成立,KKT条件:η<sub>i</sub>≥0η<sub>i</sub>[y<sub>i</sub>(w·x<sub>i</sub>+b)‑1]=0将拉格朗日函数变换成仅包含拉格朗日乘子的函数,变换如下:<maths num="0005"><math><![CDATA[<mrow><mfrac><mrow><mo>&part;</mo><msub><mi>L</mi><mi>P</mi></msub></mrow><mrow><mo>&part;</mo><mi>w</mi></mrow></mfrac><mo>=</mo><mn>0</mn><mo>&DoubleRightArrow;</mo><mi>w</mi><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>&eta;</mi><mi>i</mi></msub><msub><mi>y</mi><mi>i</mi></msub><msub><mi>X</mi><mi>i</mi></msub></mrow>]]></math><img file="FDA0001132255380000051.GIF" wi="534" he="135" /></maths>将<img file="FDA0001132255380000052.GIF" wi="483" he="135" />代入<img file="FDA0001132255380000053.GIF" wi="746" he="127" />得:<img file="FDA0001132255380000054.GIF" wi="701" he="150" />在这个拉格朗日对偶函数中,只有拉格朗日乘子和训练集数据,避开了w和b,使未知量减少,同时,原来求拉格朗日函数的最小值,在此刻由于第二项是个负号,所以变为求对偶函数的最大化问题,然后在运用大量的数据集,找到一组拉格朗日乘子η<sub>i</sub>,再代入<img file="FDA0001132255380000055.GIF" wi="518" he="140" />和η<sub>i</sub>[y<sub>i</sub>(w·x<sub>i</sub>+b)‑1]=0分别求出w和b的可行解,在对所有的b值进行平均作为最后的值,此时决策边界确定,可表示为:<img file="FDA0001132255380000056.GIF" wi="574" he="189" />3.6)当检测实例z时,可应用分类模型:<img file="FDA0001132255380000057.GIF" wi="1030" he="149" />进行,f(z)=1是一次短路熔痕,若f(z)=‑1则是二次短路熔痕;3.7)组合分类模型,提升分类准确率所有金相图片根据鉴定结果已知是一次短路和二次短路,故构成有标识的训练集,基于均匀概率分布原理,在训练集中重复抽取样本数据,组成自主样本集,也就是形成子训练集D<sub>i</sub>,i=k,k是根据训练精度决定的一个整数,在D<sub>i</sub>上训练分类模型C<sub>i</sub>:w·Φ(x)+b=0,这样得到k个基分类模型,通过对k个基分类模型所做的预测结果,使用多数表决来分类,由于y的值不是‑1就是1,对y的预测值求和,然后由结果的符号决定,即:<maths num="0006"><math><![CDATA[<mrow><mi>f</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow><mo>=</mo><mi>s</mi><mi>i</mi><mi>g</mi><mi>n</mi><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>k</mi></munderover><mrow><mo>(</mo><msub><mi>w</mi><mi>i</mi></msub><mo>&CenterDot;</mo><mi>z</mi><mo>+</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>.</mo></mrow>]]></math><img file="FDA0001132255380000061.GIF" wi="691" he="174" /></maths>
地址 510275 广东省广州市海珠区新港西路135号