发明名称 基于张量动态纹理模型的极光视频分类方法
摘要 本发明公开了一种基于张量动态纹理模型的极光视频分类方法,主要解决现有技术无法直接对极光视频进行分类,只能进行单帧操作,分类准确率和分类效率较低的问题。其实现步骤是:(1)获取训练极光视频和测试极光视频;(2)提取训练极光视频和测试极光视频的混合观测矩阵;(3)对训练极光视频和测试极光视频的混合观测矩阵进行优化;(4)用训练极光视频的最优混合观测矩阵训练支持向量机,得到SVM分类器;(5)用SVM分类器对测试极光视频进行分类。本发明能实现对现有四类极光视频的计算机自动分类,且具有分类准确率高的优点,可用于极光视频的特征提取和计算机图像识别。
申请公布号 CN104992187A 申请公布日期 2015.10.21
申请号 CN201510412525.0 申请日期 2015.07.14
申请人 西安电子科技大学 发明人 韩冰;宋亚婷;高新波;李洁;王平;仇文亮;王颖;王秀美
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 一种基于张量动态纹理模型的极光视频分类方法,包括如下步骤:1)从已标记类别的极光视频数据库中任取N个视频组成训练集{y<sub>1</sub>,y<sub>2</sub>,...,y<sub>k</sub>,...,y<sub>N</sub>},y<sub>k</sub>是第k个训练集样本,k=1,2,...,N,将剩余极光视频组成测试集,从测试集中取一个样本作为测试极光视频y<sub>test</sub>;2)提取测试极光视频y<sub>test</sub>的混合观测矩阵C':2a)将测试极光视频y<sub>test</sub>表示为y'(t),<img file="FDA0000759209560000011.GIF" wi="284" he="83" />I<sub>1</sub>为当前视频帧像素矩阵的行数,I<sub>2</sub>为当前视频帧像素矩阵的列数,t=1,...,τ,τ是视频总帧数;2b)用观测到的极光视频帧y'(t)组成视频张量Y':<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msup><mi>Y</mi><mo>&prime;</mo></msup><mo>=</mo><mo>&lsqb;</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow><mo>,</mo><mo>...</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>,</mo><mo>...</mo><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>&tau;</mi><mo>)</mo></mrow><mo>&rsqb;</mo><mo>,</mo><msup><mi>Y</mi><mo>&prime;</mo></msup><mo>&Element;</mo><msup><mi>R</mi><mrow><msub><mi>I</mi><mn>1</mn></msub><mo>&times;</mo><msub><mi>I</mi><mn>2</mn></msub><mo>&times;</mo><mi>&tau;</mi></mrow></msup><mo>;</mo></mrow>]]></math><img file="FDA0000759209560000012.GIF" wi="1007" he="77" /></maths>2c)令i=1,2,3,将极光视频张量Y'按第i维展开,得到展开矩阵Y'<sub>(i)</sub>,即<img file="FDA0000759209560000013.GIF" wi="268" he="89" /><img file="FDA0000759209560000014.GIF" wi="286" he="92" />Y'<sub>(3)</sub>∈R<sup>τ×g</sup>,其中e=I<sub>2</sub>×τ,f=I<sub>1</sub>×τ,g=I<sub>1</sub>×I<sub>2</sub>;2d)对展开矩阵Y'<sub>(i)</sub>进行SVD分解,将其分为三个矩阵,即Y'<sub>(i)</sub>=U<sup>(i)</sup>S<sup>(i)</sup>V<sup>(i)H</sup>,其中U<sup>(i)</sup>∈R为左基矩阵,S<sup>(i)</sup>为奇异值矩阵,V<sup>(i)</sup>为右基矩阵;当i=1时,左基矩阵<img file="FDA0000759209560000015.GIF" wi="238" he="76" />为行观测矩阵,对应的奇异值矩阵为<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msup><mi>S</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msup><mo>&Element;</mo><msup><mi>R</mi><mrow><msub><mi>r</mi><mn>1</mn></msub><mo>&times;</mo><msub><mi>r</mi><mn>1</mn></msub></mrow></msup><mo>,</mo></mrow>]]></math><img file="FDA0000759209560000016.GIF" wi="254" he="73" /></maths>右基矩阵为<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msup><mi>V</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msup><mo>&Element;</mo><msup><mi>R</mi><mrow><msub><mi>r</mi><mn>1</mn></msub><mo>&times;</mo><mi>e</mi></mrow></msup><mo>;</mo></mrow>]]></math><img file="FDA0000759209560000017.GIF" wi="251" he="74" /></maths>当i=2时,左基矩阵<img file="FDA0000759209560000018.GIF" wi="249" he="69" />为列观测矩阵,对应的奇异值矩阵为<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msup><mi>S</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msup><mo>&Element;</mo><msup><mi>R</mi><mrow><msub><mi>r</mi><mn>2</mn></msub><mo>&times;</mo><msub><mi>r</mi><mn>2</mn></msub></mrow></msup><mo>,</mo></mrow>]]></math><img file="FDA0000759209560000019.GIF" wi="262" he="69" /></maths>右基矩阵为<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msup><mi>V</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msup><mo>&Element;</mo><msup><mi>R</mi><mrow><msub><mi>r</mi><mn>2</mn></msub><mo>&times;</mo><mi>f</mi></mrow></msup><mo>;</mo></mrow>]]></math><img file="FDA00007592095600000110.GIF" wi="262" he="69" /></maths>当i=3时,左基矩阵<img file="FDA00007592095600000111.GIF" wi="232" he="70" />为张量动态纹理特征矩阵,对应的奇异值矩阵为<img file="FDA0000759209560000021.GIF" wi="257" he="77" />右基矩阵为<img file="FDA0000759209560000022.GIF" wi="258" he="75" />提取张量动态纹理特征矩阵U<sup>(3)</sup>的每一列作为张量动态纹理特征帧u(t),即U<sup>(3)</sup>=[u(1),u(2),...,u(t),...,u(τ)];2f)将行观测矩阵U<sup>(1)</sup>和列观测矩阵U<sup>(2)</sup>按列组合成混合观测矩阵C',即C'=[U<sup>(1)</sup>,U<sup>(2)</sup>];3)对测试极光视频y<sub>test</sub>的混合观测矩阵C'进行优化:3a)用极光视频张量Y',行观测矩阵U<sup>(1)</sup>,列观测矩阵U<sup>(2)</sup>,张量动态纹理特征矩阵U<sup>(3)</sup>,计算视频张量Y'的核张量Ne,即Ne=Y'×<sub>1</sub>U<sup>(1)</sup>×<sub>2</sub>U<sup>(2)</sup>×<sub>3</sub>U<sup>(3)</sup>,其中,<img file="FDA0000759209560000023.GIF" wi="289" he="64" />r<sub>1</sub>,r<sub>2</sub>,r<sub>3</sub>分别表示核张量Ne在长,宽,高3个方向上尺寸,×<sub>1</sub>表示张量的1‑mode乘积运算,×<sub>2</sub>表示张量的2‑mode乘积运算,×<sub>3</sub>表示张量的3‑mode乘积运算;3b)令核张量Ne在长,宽,高3个方向上尺寸r<sub>1</sub>,r<sub>2</sub>,r<sub>3</sub>均等于等核张量尺寸r,即r<sub>1</sub>=r<sub>2</sub>=r<sub>3</sub>=r;3c)求当等核张量尺寸r=2,6,10,14,20,24时,对应的6个合成视频帧y<sub>r</sub>(τ+1),即y<sub>2</sub>(τ+1),y<sub>6</sub>(τ+1),y<sub>10</sub>(τ+1),y<sub>14</sub>(τ+1);3d)把得到的6个合成视频帧y<sub>2</sub>(τ+1),y<sub>6</sub>(τ+1),y<sub>10</sub>(τ+1),y<sub>14</sub>(τ+1),y<sub>20</sub>(τ+1),y<sub>24</sub>(τ+1)均显示为图像,并与原视频帧y(τ)进行人工比对,选取与原视频帧y(τ)相似度最高的合成视频帧y<sub>r</sub>(τ+1)对应的最小r值,作为最优等核张量尺寸r';3e)用最优等核张量尺寸r'替换步骤2)中核张量在长,宽,高3个方向上尺寸r<sub>1</sub>,r<sub>2</sub>,r<sub>3</sub>,求取测试极光视频y<sub>test</sub>的最优混合观测矩阵C”;4)对SVM支持向量机进行训练,得到训练好的SVM分类器:4a)用上述计算测试极光视频y<sub>test</sub>最优混合观测矩阵C”的方法,计算训练集{y<sub>1</sub>,y<sub>2</sub>,...,y<sub>k</sub>,...,y<sub>N</sub>}中训练集样本y<sub>k</sub>的最优混合观测矩阵C”<sub>k</sub>,得到训练集{y<sub>1</sub>,y<sub>2</sub>,...,y<sub>k</sub>,...,y<sub>N</sub>}对应的最优混合观测矩阵集{C”<sub>1</sub>,C”<sub>2</sub>,...,C”<sub>k</sub>,...,C”<sub>N</sub>},k=1,2,...,N;4b)将每一个训练集样本y<sub>k</sub>的最优混合观测矩阵C”<sub>k</sub>拉成一个列向量,并将这些列向量连同从训练集样本y<sub>k</sub>中对应的类别信息一起输入到SVM支持向量机,对SVM支持向量机的拟合参数进行训练,得到训练好的SVM分类器;5)对测试极光视频y<sub>test</sub>进行分类;将测试极光视频y<sub>test</sub>的最优混合观测矩阵C”输入到训练好的SVM分类器中,完成对测试极光视频y<sub>test</sub>的分类。
地址 710071 陕西省西安市太白南路2号
您可能感兴趣的专利