发明名称 一种基于分数阶傅里叶变换的单目动态手势识别方法
摘要 本发明涉及一种在智能电视及职能机顶盒领域应用的人机交互输入技术,特别是涉及一种基于分数阶傅里叶变换的单目动态手势识别方法,首先对人体的肤色图像关键帧进行选取,然后对选取的图像进行预处理,再进行人手区域规范化处理,利用二维分数阶傅里叶变换进行变换,最后经过分类器,对不同的手势进行识别;本发明有效提高和优化人手在运动状态、不同手势操作时的识别效率和识别准确度,提高和优化了智能电视盒和智能机顶盒人机交互的用户体验,使操作起来更方便快捷。
申请公布号 CN103077381A 申请公布日期 2013.05.01
申请号 CN201310006917.8 申请日期 2013.01.08
申请人 郑州威科姆科技股份有限公司 发明人 贾小波;张永强;牛伟涛;马鹏阁;金秋春;惠作奎
分类号 G06K9/00(2006.01)I;G06F17/14(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 郑州大通专利商标代理有限公司 41111 代理人 陈大通
主权项 1.一种基于分数阶傅里叶变换的单目动态手势识别方法,其特征在于包括以下步骤:步骤1:用色彩聚类算法将原始的肤色图像的集合分组成为由类似对象组成的多个聚类,并对其进行非线性分段变换,得到肤色图像的聚类在YCb′Cr'空间中的分布情况,再将其投影到Cb′-Cr′二维子空间,得到肤色聚类模型;步骤2:采用迭代法对步骤1中的零散肤色区域进行合并处理,确定人手肤色的区域;步骤3:据小波包对人手手指特征分解的原理并结合人手的几何特征,确定人手所在的区域,检测到人手后,将此坐标信息作为光标位置的控制消息;步骤4:对步骤3中所得的人手所在的区域进行规范化处理,包括:步骤4.1:对人手所在区域的图像统计其直方图,求出P<sub>r</sub>(r),所述Pr(r)为出现这个灰度级的概率P(Rk),所述直方图的横坐标为灰度级r,纵坐标为具有该灰度级的像素个数或出现这个灰度级的概率P(Rk),其中P(Rk)=nk/N,式中,N为一幅图像中的像素的总数,nk为图像中第k级灰度的像素数,Rk表示第k个灰度级,P(rk)表示该灰度级出现的概率;步骤4.2:采用累积分布函数对步骤4.1中所统计出的直方图做变换,即S<sub>k</sub>=T(r<sub>k</sub>)=∑p<sub>r</sub>(r),以此求出变换后的新灰度,式中r<sub>k</sub>和S<sub>k</sub>分别表示原始图像和变换后的第k阶图像灰度的值,Pr(r)为出现这个灰度级的概率P(Rk);步骤5:利用二维分数阶傅里叶变换提取人手图像的幅度和相位特征信息;a)首先对人手图像做傅里叶变换,变换公式为:<img file="FDA00002714290700021.GIF" wi="676" he="75" />取P1=P2,阶次选择范围在[0,1]之间,间隔为0.1;b)其次,对二维分数阶傅里叶变换进行特征提取,取f(x,y)为原人手图像灰度值信息,对f(x,y)做二维分数阶傅里叶变换即为:<maths num="0001"><![CDATA[<math><mrow><msub><mi>F</mi><mrow><mi>&alpha;</mi><mo>,</mo><mi>&beta;</mi></mrow></msub><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mrow><mo>+</mo><mo>&infin;</mo></mrow></munderover><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mrow><mo>+</mo><mo>&infin;</mo></mrow></munderover><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><msub><mi>K</mi><mrow><mi>p</mi><mo>,</mo><mi>q</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mi>dxdy</mi><mo>,</mo></mrow></math>]]></maths>经计算相位信息可以表示为:<img file="FDA00002714290700023.GIF" wi="576" he="172" />其中K<sub>p,q</sub>(x,y,u,v)为二维分数阶傅里叶变换的核函数,其中<img file="FDA00002714290700024.GIF" wi="212" he="103" /><img file="FDA00002714290700025.GIF" wi="207" he="116" />p和q分别为变换阶次,K<sub>p,q</sub>(x,y,u,v)为变换核;步骤6:把步骤5中b)中求出的人手图像的相位幅值采用Fisher分类器判别人手图像的类别。
地址 450001 河南省郑州市高新技术开发区莲花街5号