主权项 |
能够对驾驶人手势进行识别的系统,其特征在于,包括以下步骤:(1)手势预处理:用几个像素灰度的平均值来代替每个像素的灰度,假定有一幅NXN个像素的图像f(x,y),平滑处理后得到一幅图像g(x,y),g(x,y)由下式决定:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>g</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munder><mo>Σ</mo><mrow><mo>(</mo><mi>m</mi><mo>,</mo><mi>n</mi><mo>)</mo><mi>ω</mi><mi>s</mi></mrow></munder><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>,</mo><mi>n</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827593540000011.GIF" wi="806" he="143" /></maths>式中,0,1,,,N‑1s是点伍纠所在领域的中点的坐标集合,但不包括(x,y)点;M是集合内坐标点的总数,将RGB转换为HSI所用的变换为:<img file="FDA0000827593540000012.GIF" wi="686" he="158" />其中:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>θ</mi><mo>=</mo><mi>a</mi><mi>r</mi><mi>c</mi><mi>c</mi><mi>o</mi><mi>s</mi><mo>{</mo><mfrac><mrow><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>[</mo><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mi>G</mi><mo>)</mo></mrow><mo>+</mo><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mi>B</mi><mo>)</mo></mrow><mo>]</mo></mrow><msup><mrow><mo>[</mo><msup><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mi>G</mi><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mi>B</mi><mo>)</mo></mrow><mrow><mo>(</mo><mi>G</mi><mo>-</mo><mi>B</mi><mo>)</mo></mrow><mo>]</mo></mrow><mfrac><mn>1</mn><mn>2</mn></mfrac></msup></mfrac><mo>}</mo></mrow>]]></math><img file="FDA0000827593540000013.GIF" wi="821" he="254" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>S</mi><mo>=</mo><mn>1</mn><mo>-</mo><mfrac><mn>3</mn><mrow><mo>(</mo><mi>R</mi><mo>+</mo><mi>G</mi><mo>+</mo><mi>B</mi><mo>)</mo></mrow></mfrac><mo>[</mo><mi>m</mi><mi>i</mi><mi>n</mi><mrow><mo>(</mo><mi>R</mi><mo>,</mo><mi>G</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow><mo>]</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>-</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827593540000014.GIF" wi="1174" he="135" /></maths><maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>I</mi><mo>=</mo><mfrac><mn>1</mn><mn>3</mn></mfrac><mrow><mo>(</mo><mi>R</mi><mo>+</mo><mi>G</mi><mo>+</mo><mi>B</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827593540000015.GIF" wi="350" he="127" /></maths>图像的二值化就是指把多灰度级的图像变成只有两个灰度级的图像,把其中感兴趣的目标像素作为前景像素,其余部分作为背景像素,设图像f(x,y)的灰度值范围在[a,b],二值化的闽值设为t(a≤t≤b),则图像一值化的一般表达式为:<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mi>g</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = "}"><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>≥</mo><mi>t</mi></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo><</mo><mi>t</mi></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>-</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827593540000016.GIF" wi="702" he="158" /></maths>得到的g(x,y)就是二值图像,阈值t不同,得到的二值图像g(x,y)也是不同的,因此要达到理想的分割效果,选择合适的闽值t是至关重要的,图像二值化方法分为三种:整体闽值二值化、局部闽值二值化以及动态闽值二值化;(2)HSV与RGB转换的公式如下:<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><mi>H</mi><mo>=</mo><mi>a</mi><mi>r</mi><mi>c</mi><mi>c</mi><mi>o</mi><mi>s</mi><mo>{</mo><mfrac><mrow><mo>[</mo><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mi>G</mi><mo>)</mo></mrow><mo>+</mo><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mi>B</mi><mo>)</mo></mrow><mo>]</mo><mo>/</mo><mn>2</mn></mrow><msup><mrow><mo>[</mo><msup><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mi>G</mi><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mi>B</mi><mo>)</mo></mrow><mrow><mo>(</mo><mi>G</mi><mo>-</mo><mi>B</mi><mo>)</mo></mrow><mo>]</mo></mrow><mfrac><mn>1</mn><mn>2</mn></mfrac></msup></mfrac><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>-</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827593540000021.GIF" wi="974" he="222" /></maths><maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><mi>S</mi><mo>=</mo><mn>1</mn><mo>-</mo><mfrac><mn>3</mn><mrow><mo>(</mo><mi>R</mi><mo>+</mo><mi>G</mi><mo>+</mo><mi>B</mi><mo>)</mo></mrow></mfrac><mo>[</mo><mi>m</mi><mi>i</mi><mi>n</mi><mrow><mo>(</mo><mi>R</mi><mo>,</mo><mi>G</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow><mo>]</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>-</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827593540000022.GIF" wi="828" he="149" /></maths><maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><mi>V</mi><mo>=</mo><mfrac><mn>1</mn><mn>3</mn></mfrac><mrow><mo>(</mo><mi>R</mi><mo>+</mo><mi>G</mi><mo>+</mo><mi>B</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000827593540000023.GIF" wi="358" he="119" /></maths>首先,要计算被跟踪目标的色彩直方图,将RGB色彩空间转化到HSV空间,获得H分量,并计算它的1维直方图,把H分量的数值量化到『O,255],然后,根据获得的色彩直方图将原始图像反向投影成色彩概率分布图像,在反向投影前,目标图像中的每一个象素的值描述的是在这一点的颜色信息,而投影后,图像中每一个象素的值就变成了这个颜色信息出现在此处的可能性的一种离散化的度量;(3)通过上述算法识别后,驾驶员在驾驶过程中通过手指滑动得到信息。 |