发明名称 一种图像主要目标的定位与识别方法
摘要 本发明涉及一种图像主要目标定位与识别方法,属于数字图像处理领域。其具体操作步骤为:①从待识别图像中识别单体目标;②从待识别图像中识别关系目标;③确定候选主要目标区域;④从候选主要目标区域中确定主要目标。本发明提出的一种图像主要目标定位与识别方法,可以在待识别图像中快速识别图像主要目标,该方法适用于计算机快速自动发现、定位冗长视频中包含犯罪活动或犯罪分子的关键帧。
申请公布号 CN103824067A 申请公布日期 2014.05.28
申请号 CN201410100575.0 申请日期 2014.03.18
申请人 北京理工大学 发明人 李侃;白琳;徐琛
分类号 G06K9/00(2006.01)I;G06K9/32(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 代理人
主权项 1.一种图像主要目标的定位与识别方法,其特征在于:其具体操作步骤为:步骤一、从待识别图像中识别单体目标,操作步骤包括:步骤1.1:轮廓模型集合中包含单体轮廓模型和关系轮廓模型;单体轮廓模型和关系轮廓模型均为m×n的矩阵模型,其中,m、n∈(0,300),且m、n均为正整数;依次使用轮廓模型集合中的每个单体轮廓模型对待识别图像进行步骤1.2的操作;步骤1.2:使用当前单体轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来;经过步骤一的操作,可以得到待识别图像中的单体目标;步骤二、从待识别图像中识别关系目标,操作步骤包括:步骤2.1:依据搜索关键词,从轮廓模型集合中的关系模型子集中找到含有关键词的关系模型;步骤2.2:依次使用步骤2.1得到的关系轮廓模型对待识别图像进行步骤2.3的操作;步骤2.3:使用当前关系轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来,得到关系目标;经过步骤二的操作,可以得到待识别图像中的关系目标;步骤三、确定候选主要目标区域;依次查看步骤二得到的每个关系目标是否包含步骤一得到的某个单体目标,如包含,则将该关系目标设定为候选主要目标区域;候选主要目标区域构成候选主要目标区域集合,用符号W表示,W={w<sub>1</sub>,w<sub>2</sub>,……,w<sub>r</sub>},其中,r为候选主要目标区域的数量,w<sub>i</sub>为候选主要目标区域,1≤i≤r;步骤四、从候选主要目标区域中确定主要目标,操作步骤包括:步骤4.1:对步骤三得到的候选主要目标区域集合W中的候选主要目标区域w<sub>i</sub>依次进行步骤4.2至步骤4.5的操作;步骤4.2:对候选主要目标区域w<sub>i</sub>使用17种不同的滤波器进行滤波,提取34维特征向量;步骤4.3:将候选主要目标区域w<sub>i</sub>分割为K个大小为3×3像素的图像块,K是候选主要目标区域w<sub>i</sub>能够分成的图像块的个数;步骤4.4:遍历候选主要目标区域w<sub>i</sub>中的3×3像素的图像块,用符号k<sub>j</sub>表示当前3×3像素的图像块,将图像块k<sub>j</sub>扩展为3种不同分辨率的图像,非别是原始分辨率图像、1/3原始分辨率图像和1/9原始分辨率图像;步骤4.5:使用联合高斯马尔科夫随机场,求解公式(2)的最大似然概率计算候选主要目标区域w<sub>i</sub>的绝对深度值;<maths num="0001"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><mi>d</mi><mo>|</mo><mi>X</mi><mo>;</mo><mi>&theta;</mi><mo>,</mo><mi>&sigma;</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>Z</mi></mfrac><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><mfrac><msup><mrow><mo>(</mo><msub><mi>d</mi><mi>j</mi></msub><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow><mo>-</mo><msubsup><mi>x</mi><mi>j</mi><mi>T</mi></msubsup><mi>&theta;</mi><mo>)</mo></mrow><mn>2</mn></msup><mrow><mn>2</mn><msubsup><mi>&sigma;</mi><mn>1</mn><mn>2</mn></msubsup></mrow></mfrac></mrow><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>s</mi><mo>=</mo><mn>1</mn></mrow><mn>3</mn></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><munder><mi>&Sigma;</mi><mrow><mi>v</mi><mo>&Element;</mo><msub><mi>N</mi><mi>s</mi></msub></mrow></munder><mrow><mfrac><msup><mrow><mo>(</mo><msub><mi>d</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>d</mi><mi>v</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mrow><mn>2</mn><msubsup><mi>&sigma;</mi><mn>2</mn><mn>2</mn></msubsup></mrow></mfrac><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中,P(d|X;θ,σ)表示最大似然概率,也是候选主要目标区域w<sub>i</sub>在3种分辨率下的最有可能处于的绝对深度值;Z是归一化参数;exp()表示e的指数函数;K表示候选主要目标区域w<sub>i</sub>中3×3像素的图像块数量;d<sub>j</sub>(s)代表图像块j在分辨率s中的相对深度,d<sub>j</sub>(s)的取值范围是(0,80),单位为米;s的取值为1或1/3或1/9;x<sub>j</sub>表示图像块j的绝对深度向量,x<sub>j</sub>的取值范围是(0,80),单位为米;θ、σ<sub>1</sub>、σ<sub>2</sub>是模型参数;N<sub>s</sub>代表在尺度s下与图像块j相邻的四个图像块;步骤4.6:设定阈值,将绝对深度值小于阈值的所有图像块标记为主要目标区域,主要目标区域中的对象即为图像中的主要目标。
地址 100081 北京市海淀区中关村南大街5号