发明名称 被动式及交互式实时影像辨识方法
摘要 本发明为一种被动式及交互式实时影像辨识方法,特别是指一种不受环境光源与噪声影响的实时影像辨识方法,包括有被动式与交互式的辨识方法,通过影像投射装置投射影像,先行建立8bits灰阶值固定背景影像以作为基准参考影像,并以摄影机不断地对影像投射装置投射出的影像区域撷取实时8bits灰阶值影像与基准参考影像,进行影像相减及影像二值化等运算步骤,即可快速准确辨识移动物体的活动,以进行感应检测是否有遮蔽到投射影像的感应区域,并执行对应的动作。
申请公布号 CN101075295A 申请公布日期 2007.11.21
申请号 CN200610078228.8 申请日期 2006.05.16
申请人 崴擎科技股份有限公司 发明人 熊兆王
分类号 G06K9/60(2006.01) 主分类号 G06K9/60(2006.01)
代理机构 北京三幸商标专利事务所 代理人 刘激扬
主权项 1.一种被动式实时影像辨识方法,其主要辨识方法如下:步骤一:以摄影机撷取影像投射装置投射至影像区域的影像作为基准参考影像,形成灰阶值矩阵;步骤二:以摄影机不断撷取影像投射装置投射至影像区域的实时影像,并形成灰阶值矩阵;通过上述步骤一的基准参考影像与步骤二的实时影像,由式子(1)计算它们的差异值: DIFF(x,y)=|REF(x,y)-NEW(x,y)| (1)步骤三:将步骤一的基准参考影像的各灰阶值与步骤二的实时影像相应的各灰阶值相减,即可得到剩余的影像灰阶值分布;步骤四:经步骤三相减后的影像,通常会有噪声存在,通过式子(2)消除噪声杂点的影响;<math> <mrow> <mi>BIN</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mn>255</mn> </mtd> <mtd> <mi>DIFF</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <msup> <mi>T</mi> <mo>*</mo> </msup> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mi>DIFF</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msup> <mi>T</mi> <mo>*</mo> </msup> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow> </math> 式子(2)为二值化的方法消除噪声杂点的影响;其中,T*为门限值,在8bits灰阶影像中,门限值的范围为0~255之间;而最佳门限值的决定方式可由统计的方式求得,其最佳门限值为波谷位置的灰阶值,通过决定T*即可将影像分割成二区间C1,C2,其最佳门限值T*的条件为C1内的变异数加上C2内的变异数的和为最小,假设影像的大小N,且8bits灰阶影像的灰阶值个数为I=256,则灰阶值为I的概率可表示为式子(3):<math> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msub> <mi>n</mi> <mi>i</mi> </msub> <mi>N</mi> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow> </math> 此处ni表示灰阶值i在影像中出现的次数,且i的范围介于0≤i≤I-1,依据概率原理可得知式子(4):<math> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>I</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>1</mn> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow> </math> 假设C1内的像素个数占的比率为式子(5):<math> <mrow> <msub> <mi>W</mi> <mn>1</mn> </msub> <mo>=</mo> <mi>Pr</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <msup> <mi>T</mi> <mo>*</mo> </msup> </munderover> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow> </math> 而C2内的像素个数占的比率为式子(6):<math> <mrow> <msub> <mi>W</mi> <mn>2</mn> </msub> <mo>=</mo> <mi>Pr</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <msup> <mi>T</mi> <mo>*</mo> </msup> <mo>+</mo> <mn>1</mn> </mrow> <mrow> <mi>I</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow> </math> 这里亦满足W1+W2=1,接下来,算出C1的期望值,为式子(7):<math> <mrow> <msub> <mi>U</mi> <mn>1</mn> </msub> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <msup> <mi>T</mi> <mo>*</mo> </msup> </munderover> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <msub> <mi>W</mi> <mn>1</mn> </msub> </mfrac> <mo>&times;</mo> <mi>i</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow> </math> 而C2的期望值为式子(8):<math> <mrow> <msub> <mi>U</mi> <mn>2</mn> </msub> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <msup> <mi>T</mi> <mo>*</mo> </msup> <mo>+</mo> <mn>1</mn> </mrow> <mrow> <mi>I</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <msub> <mi>W</mi> <mn>2</mn> </msub> </mfrac> <mo>&times;</mo> <mi>i</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow> </math> 利用式子(7)和式子(8)可求得C1和C2的变异数分别为式子(9)和式子(10):<math> <mrow> <msubsup> <mi>&sigma;</mi> <mn>1</mn> <mn>2</mn> </msubsup> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <msup> <mi>T</mi> <mo>*</mo> </msup> </munderover> <msup> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <msub> <mi>U</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <msub> <mi>W</mi> <mn>1</mn> </msub> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow> </math> <math> <mrow> <msubsup> <mi>&sigma;</mi> <mn>2</mn> <mn>2</mn> </msubsup> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <msup> <mi>T</mi> <mo>*</mo> </msup> <mo>+</mo> <mn>1</mn> </mrow> <mrow> <mi>I</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msup> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <msub> <mi>U</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <msub> <mi>W</mi> <mn>2</mn> </msub> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow> </math> 则C1和C2的变异数和为式子(11):<math> <mrow> <msubsup> <mi>&sigma;</mi> <mi>w</mi> <mn>2</mn> </msubsup> <mo>=</mo> <msub> <mi>W</mi> <mn>1</mn> </msub> <msubsup> <mi>&sigma;</mi> <mn>1</mn> <mn>2</mn> </msubsup> <mo>+</mo> <msub> <mi>W</mi> <mn>2</mn> </msub> <msubsup> <mi>&sigma;</mi> <mn>2</mn> <mn>2</mn> </msubsup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>11</mn> <mo>)</mo> </mrow> </mrow> </math> 接着,只要将0~255之间的数值代入式子(11)中,使式子(11)有最小值的数值就是最佳门限值T*;步骤五:虽经步骤四二值化后所残留的噪声已消除,移动物体会有一些的残破,此种现象通过四连通屏蔽及其膨胀、侵蚀的算法来加以去除;其中,膨胀的算法如下:当屏蔽Mb(i,j)=255时,便设定其四邻点位置的屏蔽为式子(12):Mb(i,j-1)=Mb(i,j+1)=Mb(i-1,j)=Mb(i+1,j)=255 (12)侵蚀的算法如下:当屏蔽时Mb(i,j)=0,便设定其四邻点位置的屏蔽为式子(13):Mb(i,j-1)=Mb(i,j+1)=Mb(i-1,j)=Mb(i+1,j)=0 (13)将上述的屏蔽与二值化后的影像作回旋积分即可消除破碎的现象;步骤六:利用侧边屏蔽来取得移动物体的轮廓,此处,我们将采用影像轮廓运算屏蔽屏蔽来完成物体轮廓的取得;将影像轮廓运算屏蔽屏蔽与实时影像作回旋积分,如式子(14)(15)所示:Gx(x,y)=(NEW(x-1,y+1)+2×NEW(x,y+1)+NEW(x+1,y+1))- (NEW(x-1,y-1)+2×NEW(x,y-1)+NEW(x+1,y-1)) (14)Gy(i,j)=(NEW(x+1,y-1)+2×NEW(x+1,y)+NEW(x+1,y+1))- (NEW(x-1,y-1)+2×NEW(x-1,y)+NEW(x-1,y+1)) (15)利用式子(16)便可得到所撷取影像的边缘,<math> <mrow> <mi>G</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <msqrt> <msub> <mi>G</mi> <mi>x</mi> </msub> <msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>G</mi> <mi>y</mi> </msub> <msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mn>2</mn> </msup> </msqrt> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>16</mn> <mo>)</mo> </mrow> </mrow> </math> 将上述的边缘影像通过式子(17)进行二值化,<math> <mrow> <mi>E</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mn>255</mn> </mtd> <mtd> <mi>G</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <msubsup> <mi>T</mi> <mi>e</mi> <mo>*</mo> </msubsup> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mi>G</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msubsup> <mi>T</mi> <mi>e</mi> <mo>*</mo> </msubsup> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>17</mn> <mo>)</mo> </mrow> </mrow> </math> 其中Te *为最佳门限值,求取最佳门限值的方法和上述步骤四中的相同;接着,将实时影像的二值化轮廓图E(x,y)与相减后的二值化影像BIN(x,y)进行交集的操作,移动物体的外围轮廓即可求得;步骤七:感应检测移动物体的外围轮廓边点的坐标是否接触到感应区域,并执行对应的动作;步骤八:重复上述的所有步骤。
地址 台湾省台北市忠孝东路4段512号12楼之2