发明名称 用于增强现实辅助维修系统的三维对象识别定位方法
摘要 本发明涉及一种用于增强现实辅助维修系统的三维对象识别定位方法,该方法包括:建立三维对象的信息数据库、三维对象的分割与特征的提取、对象类别的识别和对象的定位。本发明是一种全局边缘直方图与角点引导的局部边缘直方图相组合的三维对象特征描述方法,通过该描述方法对各个三维对象不同视角的二维图像进行特征提取,并采用Gentle AdaBoost多类分类器对提取的特征向量进行训练,可以较高的检测率实现对三维对象的类别识别。本发明还将机器学与模板匹配方法相结合,通过搜索小范围局部数据库进行匹配定位,提高了定位效率。
申请公布号 CN106203446A 申请公布日期 2016.12.07
申请号 CN201610519065.6 申请日期 2016.07.05
申请人 中国人民解放军63908部队 发明人 张勇;王伟明;赵守伟;李欣
分类号 G06K9/46(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/46(2006.01)I
代理机构 石家庄国域专利商标事务所有限公司 13112 代理人 胡澎
主权项 一种用于增强现实辅助维修系统的三维对象识别定位方法,其特征是,包括以下步骤:a、建立三维对象的信息数据库:a‑1、将与增强现实辅助维修过程具有信息关联的设备零部件作为三维对象,并对应标记为O<sub>1</sub>,O<sub>2</sub>,…,O<sub>k</sub>;建立各三维对象的两种视角变化密度不同的w<sub>t</sub>×h<sub>t</sub>二维图像模板,其中一种为视角变化间隔为10°的模板,记做TA,另一种为视角变化间隔为2.5°的模板,记做TB;将各三维对象的所有模板TA和模板TB关联到其二维图像模板所对应的视角中,并按视角类别保存到模板数据库中;a‑2、分别提取各三维对象的模板TA和模板TB的边缘图像TEA、TEB,提取各三维对象的模板TA和模板TB的复合边缘直方图的特征向量FA、FB,关联到各自对应的模板TA和模板TB中,并保存到信息数据库中;a‑3、将标记为O<sub>1</sub>—O<sub>k</sub>的三维对象的各自对应的复合边缘直方图特征向量FA及其对应的类别标签送入分类器进行训练,获得全部三维对象的类别识别模型M<sub>a</sub>,并进行存储;分别去除每一个三维对象的复合边缘直方图的特征向量FA后,再次送入分类器进行训练,得到不包括所删除三维对象的识别模型M<sub>i≠1</sub>,M<sub>i≠2</sub>,…,M<sub>i≠k</sub>,并进行存储;a‑4、将所有三维对象的复合边缘直方图的特征向量FB按类别建立检索K‑D树KB<sub>1</sub>,KB<sub>2</sub>,…,KB<sub>k</sub>;b、三维对象的分割与特征的提取:b‑1、获取来自图像传感器的一帧图像I,对图像进行滤波并提取其二值边缘图像E;计算关于二值边缘图像E的积分图像II<sub>E</sub>;计算关于二值边缘图像E的积分复合边缘直方图IH<sub>E</sub>;b‑2、创建宽度为w、高度为h的滑动窗口W1,创建宽度为(w+2)、宽度为(h+2)的滑动窗口W2;滑动窗口W1居中嵌套在滑动窗口W2中,并与滑动窗口W2同时对二值边缘图像E进行扫描,利用积分图像II<sub>E</sub>计算滑动窗口W1与滑动窗口W2的像素之和;当滑动窗口W1与滑动窗口W2的像素之和大于0且像素和之差为0时,得到未被遮挡的目标区域图像E<sub>W1</sub>,并转到步骤b‑3;如果整幅图像的扫描结果均不能满足上述条件,则w值加2,h值加2,并重复执行本步骤;当w≥图像I的宽度值且h≥图像I的高度值时,转到步骤b‑1;b‑3、利用IH<sub>E</sub>获取区域滑动窗口W1的复合边缘直方图H<sub>W</sub>,然后执行步骤c;c、对象类别的识别:读取识别模型M<sub>a</sub>,将复合边缘直方图H<sub>W</sub>作为输入向量送入读取识别模型M<sub>a</sub>,得到识别结果——复合边缘直方图H<sub>W</sub>所代表的类别标签n;d、对象的定位:d‑1、以复合边缘直方图H<sub>W</sub>与检索K‑D树KB<sub>n</sub>中特征向量的巴氏距离D1取值最小为依据,在检索K‑D树KB<sub>n</sub>中检索得到与复合边缘直方图H<sub>W</sub>最接近的特征向量位置p;d‑2、当巴氏距离D1≥阈值τ<sub>1</sub>时,直接转入步骤d‑3,否则将滑动窗口W1的二值边缘图像E<sub>W1</sub>规格化至宽度为w<sub>t</sub>、高度为h<sub>t</sub>的尺度,并根据特征向量位置k取模板图像TB<sub>n,p</sub>,将滑动窗口W1的二值边缘图像E<sub>W1</sub>和模板图像TB<sub>n,p</sub>做Chamfer距离匹配,得到匹配结果D2;当D2&lt;阈值τ<sub>2</sub>时,输出模板图像TB<sub>n,p</sub>对应的视角和滑动窗口W1的二值边缘图像E<sub>W1</sub>的规格化系数ε,完成全部定位过程并退出,否则转到步骤d‑3;d‑3、读取识别模型M<sub>i≠n</sub>,将H<sub>W</sub>作为输入向量送入M<sub>i≠n</sub>,得到识别结果——新的类别标签n,并根据类别标签n取检索K‑D树KB<sub>n</sub>,转至步骤d‑1;当识别模型M<sub>i≠1</sub>,M<sub>i≠2</sub>,…,M<sub>i≠k</sub>被遍历一次后,宣告定位失败,转至步骤d‑2。
地址 050000 河北省石家庄市北新街169号