发明名称 基于视角分类的自然标志物注册方法
摘要 本发明公开了一种基于视角分类的自然标志物注册方法,主要解决现有方法实时性差,应用局限性大,摄像机有效视角范围小的缺点。其实现步骤为:1)采集标志物原始图像和基准图像,并对摄像机视角做空间上的划分,利用图像基本几何变换生成视角类训练样本;2)检测视角类特征,二进制编码特征,计算基于二元测试的特征索引值;3)对场景图像进行基于标志物目标跟踪的特征提取,按邻近视角优先的策略进行特征检索与特征匹配;4)计算原始图像到场景图像的单应性矩阵和摄像机外参数矩阵,根据外参数矩阵得到标志物在场景中的精确位置,完成标志物注册。本发明具有实时性强,占用内存少,摄像机有效视角范围广的优势,可用于基于标志物的增强现实系统。
申请公布号 CN103353941A 申请公布日期 2013.10.16
申请号 CN201310234606.7 申请日期 2013.06.13
申请人 西安电子科技大学 发明人 李静;卢朝阳;庞若愚;李晓伟
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 1.一种基于视角分类的自然标志物注册方法,包括如下步骤:(1)采集标志物的原始图像E,并根据应用需求选择视角采集标志物的基准图像F,原始图像和基准图像的分辨率由摄像机分辨率,场景大小与标志物尺寸共同决定;(2)用SIFT算法对原始图像E和基准图像F进行匹配,用RANSAC算法估计出原始图像E到基准图像F的单应性矩阵H<sub>a</sub>;(3)设定尺度缩放因子为g∈(0,1),并构建基准图像F的N层尺度金字塔图像P<sub>n</sub>;(4)根据金字塔图像P<sub>n</sub>生成尺度和旋转视角类训练样本:(4a)在每层金子塔图像P<sub>n</sub>上生成M个尺度和旋转视角类,将第n层金字塔上第m个视角类表示为V<sub>n,m</sub>,n取1,2,…,N,m取1,2,…,M,得到全部视角类的集合:T={V<sub>n,m</sub>|n=1,2,…,N;m=1,2,…,M};(4b)在第n层金字塔上的第m个视角类V<sub>n,m</sub>中,生成K<sub>r</sub>张图像训练样本的旋转图像集:<maths num="0001"><![CDATA[<math><mrow><mo>{</mo><msubsup><mi>B</mi><mi>k</mi><mrow><mi>n</mi><mo>,</mo><mi>m</mi></mrow></msubsup><mo>|</mo><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><msub><mi>K</mi><mi>r</mi></msub><mo>}</mo><mo>;</mo></mrow></math>]]></maths>(4c)在第n层金字塔上的第m个视角类V<sub>n,m</sub>中,生成K<sub>a</sub>张图像训练样本的仿射图像集:<maths num="0002"><![CDATA[<math><mrow><mo>{</mo><msubsup><mi>A</mi><mi>k</mi><mrow><mi>n</mi><mo>,</mo><mi>m</mi></mrow></msubsup><mo>|</mo><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><msub><mi>K</mi><mi>a</mi></msub><mo>}</mo><mo>;</mo></mrow></math>]]></maths>(5)对视角类训练样本进行训练,得到标志物数据库:(5a)对第n层金字塔上的第m个视角类V<sub>n,m</sub>的图像训练样本中的旋转图像集和仿射图像集的每个图像做FAST特征点检测,得到全部图像特征点;(5b)将第n层金字塔上的第m个视角类V<sub>n,m</sub>上图像训练样本的全部图像特征点映射到原始图像E空间,利用限制最大聚类半径,且类成员与图像样本的特征点间对应关系为一对一的欧式距离聚类算法对特征点做分类,选取大小满足条件的S个聚类作为第n层金字塔上的第m个视角类V<sub>n,m</sub>的视角类特征,记为:<img file="FDA00003340024200013.GIF" wi="405" he="71" />(5c)对第n层金字塔上的第m个视角类特征<img file="FDA00003340024200014.GIF" wi="130" he="78" />利用统计采样块像素位置灰度值直方图的方法进行基于二进制编码的特征描述,得到该视角类特征向量;(5d)对第n层金字塔上的第m个视角类特征<img file="FDA00003340024200021.GIF" wi="88" he="68" />进行基于二元测试的索引值计算,选取覆盖率较大的若干个索引值作为该视角类的特征索引值;(5e)计算得到第n层金字塔上的第m个视角类特征<img file="FDA00003340024200022.GIF" wi="98" he="77" />在原始图像空间中的坐标,并将计算得到的坐标与步骤(5c)得到的视角类特征向量和步骤(5d)得到的视角类特征索引值一并作为该视角类的数据库进行保存;(5f)对其他所有视角类按照上述步骤(5a)至步骤(5e)进行处理,得到全部视角类数据库,并将该全部视角类数据库作为标志物数据库进行保存;(6)标志物实时注册:(6a)对摄像头实时获得的场景图像做FAST特征点检测,并取出特征点;(6b)对取出的特征点,利用统计采样块像素位置灰度值直方图的方法进行基于二进制编码的特征描述,得到该点特征向量;(6c)对取出的特征点做基于二元测试的特征索引值计算,得到该点特征索引值;(6d)采用邻近视角优先搜索策略在数据库中确定搜索范围;(6e)将特征点的特征索引值与搜索范围内的视角类索引值进行匹配,对于匹配成功的点进一步将该点的特征向量与视角类特征向量做SSE指令集加速的特征向量匹配;(6f)用PROSAC算法剔除误匹配,并估计得标志物原始图像平面到场景平面的单应性变换矩阵H<sub>s</sub>;(6g)根据H<sub>s</sub>和摄像机内参求解得到摄像机外参数矩阵,根据外参数矩阵获得标志物在场景中的位置,完成标志物注册。
地址 710071 陕西省西安市太白南路2号