发明名称 一种基于机器视觉的室内一般物体识别方法
摘要 本发明公开了一种基于机器视觉的室内一般物体识别方法,其包括如下步骤:1)建立一类物体的视觉词库,通过K均值聚类限定词库的规模。2)进行图像前期处理,将一幅图像用词库中的单词表示,用相似阀值近似区分背景和前景。3)图像的描述:把一幅图片包含的信息映射成一个1×(P+Q)的多维行向量(x0x1x2......xP-3xP-2xP-1y0y1y2......yQ-3yQ-2yQ-1),将图像中的特征以及特征之间的空间关系矢量化,其中P为视觉词库中单词出现的次数,Q为空间关系统计。4)运用无监督判别分类器支持向量机实现分类识别。采用这种方法使机器识别出的物体更准确。
申请公布号 CN102708380B 申请公布日期 2014.02.12
申请号 CN201210141374.6 申请日期 2012.05.08
申请人 东南大学 发明人 李新德;张晓;金晓彬
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 夏雪
主权项 一种基于机器视觉的室内一般物体识别方法,其特征是包括如下步骤:步骤11:建立一类物体的视觉词库,通过K均值聚类限定词库的规模;步骤12:进行图像前期处理,将一幅图像用词库中的单词表示,用相似阀值近似区分背景和前景;步骤13:图像的描述:把一幅图片包含的信息映射成一个1×(P+Q)的多维行向量(x0x1x2......xP‑3xP‑2xP‑1y0y1y2......yQ‑3yQ‑2yQ‑1),将图像中的特征以及特征之间的空间关系矢量化,其中P为视觉词库中单词出现的次数,Q为空间关系统计;步骤14:运用无监督判别分类器支持向量机实现分类识别;步骤15:根据公式 <mrow> <mi>Recall</mi> <mo>=</mo> <mfrac> <mrow> <mi>No</mi> <mo>.</mo> <mi>ofcorrectpositives</mi> </mrow> <mrow> <mi>tota</mi> <mi>ln</mi> <mi>umberofpositives</mi> </mrow> </mfrac> </mrow> <mrow> <mi>Precision</mi> <mo>=</mo> <mfrac> <mrow> <mi>No</mi> <mo>.</mo> <mi>ofcorretctpositives</mi> </mrow> <mrow> <mi>No</mi> <mo>.</mo> <mi>ofcorretctpositives</mi> <mo>+</mo> <mi>No</mi> <mo>.</mo> <mi>offalsepositives</mi> </mrow> </mfrac> </mrow>对目标识别系统进行性能评估,其中Recall为识别率,Precision为识别精度,No.of correct positives是正确识别的正样本的个数,total number of positive是所有正样本的个数,No.of false positives是误识别为正样本的个数;其中,步骤12中所述的区分背景和前景的方法为:步骤41:设定一个认为特征点为目标物体的特征点的阀值;步骤42:根据公式 <mrow> <mi>similarity</mi> <mrow> <mo>(</mo> <msub> <mi>M</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>N</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>M</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>N</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <msub> <mi>M</mi> <mi>i</mi> </msub> <mo>|</mo> <mo>&times;</mo> <mo>|</mo> <msub> <mi>N</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> </mfrac> </mrow>计算两描述子的相似度similarity(Mi,Nj),其中Mi为待检测图片中的第i个特征点的SIFT描述子,Nj为视觉词库中第j个视觉单词的SIFT描述子,i小于待检测图片中的特征点的个数,j小于视觉单词的个数;步骤43:将similarity(Mi,Nj)值与阀值进行比较,若similarity(Mi,Nj)值小于阀值则认为待测图片中的这个特征点为目标特征点,将其进行保留,若similarity(Mi,Nj)值不小于阀值,则将这个特征点删除;步骤44:在剩下的T个特征点中,利用特征点分布的密度特点,运用随机抽样一致性算法进行处理,去除一些干扰点;步骤44中所述的随机抽样一致性算法的步骤为:步骤51:建立模型,用一个圆形区域覆盖特征点分布密集的那部分区域,从剩下的T个特征点中随机抽取F个特征点为模型内的点keypoint;步骤52:根据公式 <mrow> <mi>maybe</mi> <mo>_</mo> <mi>center</mi> <mo>=</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mn>0</mn> </msub> <mo>,</mo> <msub> <mi>y</mi> <mn>0</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mi>F</mi> </mfrac> <mrow> <mo>(</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>F</mi> </munderover> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>F</mi> </munderover> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>计算可能的圆心maybe_center,其中x0,y0分别为可能圆心的横,纵坐标,xi,yi分别为第i个特征点的横,纵坐标,i的值不大于F;步骤53:将模型内的点keypoint与可能圆心maybe_center之间的距离按从小到大排序,取其前80%数据中的最大的一个作为可能的半径maybe_radius;步骤54:计算上述F个特征点以外的每个特征点到可能圆心maybe_center的距离,若该距离小于maybe_radius*1.2,则模型内点的个数F增加一个;步骤55:若最后模型内的点个数大于80%T,则这次建立的模型正确,保留这次的圆心maybe_center(j),此处的j表示建立模型正确的次数;步骤56:重复步骤51至55,记载建立正确模型的次数j和每次正确模型的可能半径maybe_radius(j);步骤57:根据公式 <mrow> <mi>dis</mi> <mi>tan</mi> <mi>ce</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>T</mi> </munderover> <mo>|</mo> <mi>keypoint</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>maybe</mi> <mo>_</mo> <mi>radius</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow>计算每一次正确模型中distance(j)的值,其中keypoint(t)为特征点到当次可能圆心的距离,t不大于T。
地址 210096 江苏省南京市四牌楼2号