发明名称 基于视频图像和人工神经网络的凝视点测量装置及其方法
摘要 本发明公开了一种基于视频图像和人工神经网络的凝视点测量装置及其方法,旨在提供一种测量精度较高的头部自由式凝视点测量装置及方法。测量装置,包括主机、主显示器和辅显示器,其特征是,它还包括一个立体视觉测量系统,立体视觉测量系统由光源、直流稳压电源和2个或2个以上的摄像机组成。测量方法,采用人工神经网络建立凝视点测量数学模型,人工神经网络的输入层包含12个输入节点,所述输入节点分别为左眼瞳孔的三维坐标分量、右眼瞳孔的三维坐标分量、左眼普尔钦亮斑的三维坐标分量和右眼普尔钦亮斑的三维坐标分量,人工神经网络的输出层包含2个输出节点,所述输出节点为凝视点的二维坐标分量。
申请公布号 CN103356163B 申请公布日期 2016.03.30
申请号 CN201310283618.9 申请日期 2013.07.08
申请人 东北电力大学 发明人 陈杰春;赵丽萍
分类号 A61B3/14(2006.01)I;G06N3/08(2006.01)I 主分类号 A61B3/14(2006.01)I
代理机构 吉林市达利专利事务所 22102 代理人 陈传林
主权项 一种凝视点测量方法,采用人工神经网络建立凝视点测量数学模型,所述人工神经网络的输出层包含2个输出节点,所述输出节点为凝视点的二维坐标分量,其特征是:所述人工神经网络的输入层包含12个输入节点,所述输入节点分别为左眼瞳孔的三维坐标分量、右眼瞳孔的三维坐标分量、左眼普尔钦亮斑的三维坐标分量和右眼普尔钦亮斑的三维坐标分量,包括下述步骤:(1)训练人工神经网络:(a)在辅显示器上依次显示9个或9个以上的坐标已知的标定目标;(b)一边让被测对象凝视这些标定目标,一边用立体视觉测量系统测量被测对象的左眼瞳孔三维坐标、右眼瞳孔三维坐标、左眼普尔钦亮斑三维坐标和右眼普尔钦亮斑三维坐标;(c)使用所述步骤(a)和(b)中所获取的数据训练人工神经网络;(2)使用立体视觉测量系统测量被测对象的左眼瞳孔三维坐标、右眼瞳孔三维坐标、左眼普尔钦亮斑三维坐标和右眼普尔钦亮斑三维坐标,然后由经过所述步骤(1)训练的人工神经网络计算被测对象在辅显示器上的凝视点坐标,采用Tsai摄像机模型描述摄像机的成像过程,Tsai摄像机模型中的未知参数的数值由传统标定方法确定:(d)在三维空间中人为设置或选取坐标<img file="FDA0000899458300000011.GIF" wi="341" he="71" />已知的目标点P<sub>k</sub>(k=1,2,…,N);(e)用摄像机拍摄三维点目标P<sub>k</sub>的图像,并检测其成像点的二维坐标<img file="FDA0000899458300000012.GIF" wi="236" he="70" />(f)由Tsai摄像机模型建立非线性方程组:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>f</mi><mfrac><mrow><msub><mi>r</mi><mn>11</mn></msub><msubsup><mi>x</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>r</mi><mn>12</mn></msub><msubsup><mi>y</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>r</mi><mn>13</mn></msub><msubsup><mi>z</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>t</mi><mn>1</mn></msub></mrow><mrow><msub><mi>r</mi><mn>31</mn></msub><msubsup><mi>x</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>r</mi><mn>32</mn></msub><msubsup><mi>y</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>r</mi><mn>33</mn></msub><msubsup><mi>z</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>t</mi><mn>3</mn></msub></mrow></mfrac><mo>=</mo><msubsup><mover><mi>x</mi><mo>^</mo></mover><mi>k</mi><mi>i</mi></msubsup><mo>+</mo><msub><mi>k</mi><mn>1</mn></msub><msubsup><mover><mi>x</mi><mo>^</mo></mover><mi>k</mi><mi>i</mi></msubsup><msup><mover><mi>r</mi><mo>^</mo></mover><mn>2</mn></msup></mrow>]]></math><img file="FDA0000899458300000013.GIF" wi="835" he="140" /></maths><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>f</mi><mfrac><mrow><msub><mi>r</mi><mn>21</mn></msub><msup><msubsup><mi>x</mi><mi>k</mi><mi>w</mi></msubsup><mi>w</mi></msup><mo>+</mo><msub><mi>r</mi><mn>22</mn></msub><msubsup><mi>y</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>r</mi><mn>23</mn></msub><msubsup><mi>z</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>t</mi><mn>2</mn></msub></mrow><mrow><msub><mi>r</mi><mn>31</mn></msub><msubsup><mi>x</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>r</mi><mn>32</mn></msub><msubsup><mi>y</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>r</mi><mn>33</mn></msub><msubsup><mi>z</mi><mi>k</mi><mi>w</mi></msubsup><mo>+</mo><msub><mi>t</mi><mn>3</mn></msub></mrow></mfrac><mo>=</mo><msubsup><mover><mi>y</mi><mo>^</mo></mover><mi>k</mi><mi>i</mi></msubsup><mo>+</mo><msub><mi>k</mi><mn>1</mn></msub><msubsup><mover><mi>y</mi><mo>^</mo></mover><mi>k</mi><mi>i</mi></msubsup><msup><mover><mi>r</mi><mo>^</mo></mover><mn>2</mn></msup></mrow>]]></math><img file="FDA0000899458300000014.GIF" wi="869" he="150" /></maths>                                         k=1,2,...N式中,(r<sub>ij</sub>)<sub>3×3</sub>表示世界坐标系至摄像机坐标系的过渡矩阵,(t<sub>i</sub>)<sub>3×1</sub>表示世界坐标系至摄像机坐标系的转移向量,f表示镜头焦距,<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msup><mover><mi>r</mi><mo>^</mo></mover><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>(</mo><msup><mover><mi>x</mi><mo>^</mo></mover><mi>i</mi></msup><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msup><mover><mi>y</mi><mo>^</mo></mover><mi>i</mi></msup><mo>)</mo></mrow><mn>2</mn></msup><mo>,</mo><msup><mover><mi>x</mi><mo>^</mo></mover><mi>i</mi></msup><mo>=</mo><mo>-</mo><msubsup><mi>s</mi><mi>x</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><msubsup><mi>d</mi><mi>x</mi><mo>&prime;</mo></msubsup><mrow><mo>(</mo><msup><mi>x</mi><mi>i</mi></msup><mo>-</mo><msub><mi>u</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000899458300000015.GIF" wi="885" he="78" /></maths><img file="FDA0000899458300000016.GIF" wi="406" he="87" />(u<sub>0</sub>,v<sub>0</sub>)表示光轴与像平面的交点在像平面坐标系中的坐标,d<sub>y</sub>表示图像传感器垂直方向相邻像元之间的中心距,d′<sub>x</sub>=d<sub>x</sub>N<sub>cx</sub>/N<sub>fx</sub>,d<sub>x</sub>表示图像传感器水平方向相邻像元之间的中心距,N<sub>fx</sub>表示图像传感器像元阵列的列数,N<sub>cx</sub>表示摄像机实际采集图像的列数,s<sub>x</sub>表示图像比例因子,参数N<sub>fx</sub>、N<sub>cx</sub>和s<sub>x</sub>是针对CCD摄像机提出的,在实际应用中,如果选用的是CMOS摄像机,则N<sub>cx</sub>/N<sub>fx</sub>和s<sub>x</sub>的数值均应取1;(g)求解上述非线性方程组,确定Tsai摄像机模型中的未知参数。
地址 132012 吉林省吉林市船营区长春路169号