发明名称 基于视频采集的Visual Map数据库建立方法及利用该数据库的室内视觉定位方法
摘要 基于视频采集的Visual Map数据库建立方法及利用该数据库的室内视觉定位方法,涉及室内定位导航领域。是为了解决现有方法的室内视觉定位精度低,且费时费力的问题。本发明在快速建立基于视频的Visual Map数据库的基础上,通过载有视频获取设备的平台在匀速直线过程中进行视频拍摄,并且通过对所获得的视频进行处理来记录视频中帧的坐标位置信息以及图像匹配信息。在线的定位阶段,系统将带定位用户上传的图片与基于视频的Visual Map数据库通过利用感知哈希算法计算而来的哈希值进行粗匹配,再通过获得的粗匹配帧与上传图片通过SURF算法和相应的对极几何算法来完成基于视觉的室内定位。本发明适用于室内视觉定位场合。
申请公布号 CN104457758B 申请公布日期 2017.04.12
申请号 CN201410798521.6 申请日期 2014.12.19
申请人 哈尔滨工业大学 发明人 马琳;薛昊;谭学治;何晨光
分类号 G01C21/20(2006.01)I;G06F17/30(2006.01)I 主分类号 G01C21/20(2006.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 岳泉清
主权项 基于Visual Map数据库的室内视觉定位方法,基于视频采集的Visual Map数据库建立方法,它由以下步骤实现:步骤一、根据需要定位的室内环境,选择坐标原点P0(X<sub>0</sub>,Y<sub>0</sub>),建立平面二维直角坐标系;步骤二、通过载有视频获取设备的平台在匀速直线过程中进行视频拍摄,并且通过对所获得的视频进行处理来记录视频中帧的位置坐标信息,该位置坐标通过拍摄平台的运动速度和该帧的序号以及该视频的帧速率,通过公式:<img file="FDA0001207478040000011.GIF" wi="1046" he="262" />获得;其中,n为该帧的序号,v为拍摄平台运动速度,α为拍摄平台运动方向和坐标系x轴夹角,(X<sub>0</sub>,Y<sub>0</sub>)为坐标原点,(X<sub>n</sub>,Y<sub>n</sub>)为该帧在步骤一中所建立的平面坐标系中的位置坐标;步骤三、通过感知哈希算法计算出已经标记位置坐标信息的帧的哈希值,并存储,完成Visual Map数据库的建立;基于Visual Map数据库的室内视觉定位方法,它由以下步骤实现:步骤A、通过感知哈希算法计算出待定位用户上传的图像的哈希值;步骤B、根据步骤A获得的哈希值从Visual Map数据库中搜索到4帧图像,完成粗匹配过程;步骤C、将步骤B中得到的4帧粗匹配图像与用户上传图像通过SURF算法进行匹配点计算;步骤D、通过RANSAC算法从步骤C中每对图像得到的匹配点中选择8对匹配点,并记录其相对应图像中的坐标;步骤E、将步骤D中得到的坐标通过对极几何来计算出用户的位置坐标,完成室内视觉定位;其特征是:步骤E中所述将步骤D中得到的坐标通过对极几何来计算出用户的位置坐标的具体方法为:步骤E1、采用8点法求基本矩阵F,所述基本矩阵F是对极几何的数学描述;对极几何中基本矩阵F的基本关系式为:X<sup>′T</sup>FX=0   (2)其中,X,X′分别表示两幅匹配图像中的一对匹配点在其像素坐标系中的坐标;将获得的8对匹配点X<sub>i</sub>(u<sub>i</sub>,v<sub>i</sub>,1),X<sub>i</sub>′(u<sub>i</sub>′,v<sub>i</sub>′,1),(1≤i≤8)代入公式(2)中,令基本矩阵F=(f<sub>ij</sub>),即:<img file="FDA0001207478040000021.GIF" wi="1350" he="222" />其中,f=(f<sub>11</sub>,f<sub>12</sub>,f<sub>13</sub>,f<sub>21</sub>,f<sub>22</sub>,f<sub>23</sub>,f<sub>31</sub>,f<sub>32</sub>,f<sub>33</sub>)<sup>T</sup>;求解该线性方程组,获得基本矩阵F;步骤E2、调用建立Visual Map数据库所用相机的内部参数矩阵K<sub>1</sub>,并读取待定位用户的相机内部参数矩阵K<sub>2</sub>;相机内部参数矩阵K由公式(4)给出:<img file="FDA0001207478040000022.GIF" wi="1110" he="220" />其中,f为相机焦距,k<sub>u</sub>,k<sub>v</sub>表示相机的像素点尺寸,u<sub>0</sub>,v<sub>0</sub>表示图像的尺寸即图像坐标系中u轴和v轴所包含像素点的个数,θ表示图像坐标系中u轴和v轴之间的夹角,并由公式(5)求得本质矩阵E:Ε=K<sub>2</sub><sup>T</sup>FK<sub>1</sub>   (5)步骤E3、由于步骤E2计算出的本质矩阵E包含了用户拍照位置与数据库中匹配图像所处位置之间的旋转矩阵R和转移向量t,如公式(6)所示:E=[t]<sub>×</sub>R   (6)其中,[]<sub>×</sub>表示反对称矩阵,如公式(7)所示,<img file="FDA0001207478040000023.GIF" wi="1094" he="222" />从而通过本质矩阵E求出旋转矩阵R和转移向量t;步骤E4、在步骤E3中求出的转移向量t是以用户拍照位置为参考系得出的,将其 转换至世界坐标系中,如公式(8)所示,t<sub>w</sub>=‑R<sub>r</sub><sup>‑1</sup>R<sup>‑1</sup>t   (8)其中:t<sub>w</sub>表示在规定的世界坐标系中用户拍照位置与匹配图像位置之间的方向向量,R<sub>r</sub><sup>‑1</sup>表示匹配图像在被采集时相机的旋转矩阵;步骤E5、已知世界坐标系中两幅图像的方向向量及其中一个匹配图像的二维位置坐标(X<sub>d</sub>,Y<sub>d</sub>),确定一条过匹配图像的直线,如公式(9)所示,<img file="FDA0001207478040000031.GIF" wi="1110" he="151" />其中:t<sub>w</sub>是步骤四得出的转移向量,是一个3×1的列向量,t<sub>w</sub>(2)代表t<sub>w</sub>第二行的元素,同理t<sub>w</sub>(1)代表t<sub>w</sub>第一行的元素;步骤E6、将粗匹配得到的4帧图像分别和用户上传图像按照上述步骤求出4条直线,该4条直线存在若干交点,采用公式(10)完成最优点的确定,即:定位结果的确定:<img file="FDA0001207478040000032.GIF" wi="1038" he="120" />其中:N<sub>i</sub>表示第i个匹配图像与用户提供图像的匹配点数,d<sub>i</sub>(x,y)表示选定的交点到第i个匹配图像所做直线的距离,如公式(11)表示,<img file="FDA0001207478040000033.GIF" wi="1108" he="183" />其中:a<sub>i</sub>=t(2),b<sub>i</sub>=‑t(1),c<sub>i</sub>=‑t(2)x<sub>i</sub>+t(1)y<sub>i</sub>,x<sub>i</sub>和y<sub>i</sub>表示第i幅匹配图像对应的坐标。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号