发明名称 用于图像质量评价的图像稀疏多维度特征提取方法
摘要 本发明公开了一种用于图像质量评价的图像稀疏多维度特征提取方法。本发明具体实施包括如下步骤:1.构造图像的参考块和搜索空间。2.分别在空间域和变换域寻找距离相近的块,并堆叠成组。3.堆叠后的组分别进行3D系数变换,获得多维的稀疏的变换域信息。4.提取变换域信息的直方图统计特征和位置线性拟合的相关系数。5.将上述特征构成的特征向量,利用支持向量机进行训练和分类,得到图像质量评价分数。本发明充分利用了图像全局的块相似度信息,实现了冗余特征的去除和有效的多维度稀疏特征的提取,提取的特征可以用于图像质量的客观评价。
申请公布号 CN104899874A 申请公布日期 2015.09.09
申请号 CN201510256824.X 申请日期 2015.05.19
申请人 浙江大学 发明人 丁勇;李楠;陈宏达;钱大宏;赵新宇;商小宝
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 叶志坚
主权项 用于图像质量评价的图像稀疏多维度特征提取方法,其特征在于包括如下步骤:步骤(1).输入图像I,并按一定的块宽度N<sub>patch</sub>将图像I分为互不重叠的块作为参考块空间P<sub>Ref</sub>={P<sub>i</sub>∈I:i∈¥<sup>+</sup>,i≤m},其中,P为参考图像块的总称,i为图像块的索引,¥<sup>+</sup>为正整数,m为假定的参考块个数;步骤(2).根据步骤(1)输入的图像I,并按一定的步长N<sub>step</sub>,按同样的块宽度N<sub>patch</sub>将图像I分为互相重叠的块作为参考块搜索空间P<sub>search</sub>={P′<sub>j</sub>∈I:j∈¥<sup>+</sup>,j≤n},其中P′为搜索空间图像块的总称,n为搜索空间中块的个数,j为搜索空间的块索引;同时记录每一个块的起始位置,记为:S<sub>pos</sub>={(x<sub>pj</sub>,y<sub>pj</sub>)}                      (1)其中,x<sub>pj</sub>和y<sub>pj</sub>分别对应P<sub>j</sub>块的起始位置的横纵坐标;步骤(3).在搜索空间P<sub>search</sub>中,分别找出与参考块的空间域距离和变换域距离小于一定阈值的图像块,并分别堆叠成组,记录块的起始位置形成拓扑信息,并将其从P<sub>search</sub>和S<sub>pos</sub>中取出;具体如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msup><mi>d</mi><mi>spatial</mi></msup><mrow><mo>(</mo><msub><mi>P</mi><mi>i</mi></msub><mo>,</mo><msubsup><mi>P</mi><mi>j</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow><mo>=</mo><mfrac><msubsup><mrow><mo>|</mo><mo>|</mo><msub><mi>P</mi><mi>i</mi></msub><mo>-</mo><msubsup><mi>P</mi><mi>j</mi><mo>&prime;</mo></msubsup><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><msup><mrow><mo>(</mo><msub><mi>N</mi><mi>patch</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mfrac></mrow>]]></math><img file="FDA0000720190820000011.GIF" wi="729" he="217" /></maths><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msup><mi>d</mi><mi>trans</mi></msup><mrow><mo>(</mo><msub><mi>P</mi><mi>i</mi></msub><mo>,</mo><msubsup><mi>P</mi><mi>j</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow><mo>=</mo><mfrac><msubsup><mrow><mo>|</mo><mo>|</mo><msub><mi>T</mi><mrow><mn>2</mn><mi>D</mi></mrow></msub><mrow><mo>(</mo><msub><mi>P</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>-</mo><mrow><msub><mi>T</mi><mrow><mn>2</mn><mi>D</mi></mrow></msub><mrow><mo>(</mo><msubsup><mi>P</mi><mi>j</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow></mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><msup><mrow><mo>(</mo><msub><mi>N</mi><mi>patch</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mfrac></mrow>]]></math><img file="FDA0000720190820000012.GIF" wi="977" he="231" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msubsup><mi>T</mi><mrow><mn>2</mn><mi>D</mi></mrow><mi>pq</mi></msubsup><mrow><mo>(</mo><mi>P</mi><mo>)</mo></mrow><mo>=</mo><msqrt><mfrac><mn>2</mn><msub><mi>N</mi><mi>step</mi></msub></mfrac></msqrt><mi>cos</mi><mfrac><mrow><mi>&pi;</mi><mrow><mo>(</mo><mn>2</mn><mi>q</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mi>p</mi></mrow><msub><mrow><mn>2</mn><mi>N</mi></mrow><mi>step</mi></msub></mfrac><mo>;</mo><mn>0</mn><mo>&le;</mo><mi>p</mi><mo>,</mo><mi>q</mi><mo>&le;</mo><msub><mi>N</mi><mi>step</mi></msub><mo>-</mo><mn>1</mn><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000720190820000013.GIF" wi="1397" he="224" /></maths><maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msubsup><mi>S</mi><msub><mi>P</mi><mi>i</mi></msub><mi>spatial</mi></msubsup><mo>=</mo><mo>{</mo><msup><mi>P</mi><mo>&prime;</mo></msup><mo>&Element;</mo><msub><mi>P</mi><mi>search</mi></msub><mo>:</mo><msup><mi>d</mi><mi>spatial</mi></msup><mrow><mo>(</mo><msub><mi>P</mi><mi>i</mi></msub><mo>,</mo><msup><mi>P</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>&le;</mo><msub><mi>&tau;</mi><mi>spatial</mi></msub><mo>;</mo><mo>{</mo><msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mi>spatial</mi></msub><mo>}</mo><mo>&Subset;</mo><msub><mi>S</mi><mi>pos</mi></msub><mo>}</mo></mrow>]]></math><img file="FDA0000720190820000014.GIF" wi="1702" he="104" /></maths><maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msubsup><mi>S</mi><msub><mi>P</mi><mi>i</mi></msub><mi>trans</mi></msubsup><mo>=</mo><mo>{</mo><msup><mi>P</mi><mo>&prime;</mo></msup><mo>&Element;</mo><msub><mi>P</mi><mi>search</mi></msub><mo>:</mo><msup><mi>d</mi><mi>trans</mi></msup><mrow><mo>(</mo><msub><mi>P</mi><mi>i</mi></msub><mo>,</mo><msup><mi>P</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>&le;</mo><msub><mi>&tau;</mi><mi>trans</mi></msub><mo>;</mo><mo>{</mo><msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mi>trans</mi></msub><mo>}</mo><mo>&Subset;</mo><msub><mi>S</mi><mi>pos</mi></msub><mo>}</mo></mrow>]]></math><img file="FDA0000720190820000015.GIF" wi="1584" he="102" /></maths>其中,d<sup>spatial</sup>和d<sup>trans</sup>分别代表空间域距离和变换域距离,||·||<sub>2</sub>代表l<sup>2</sup>范数,即欧氏距离,T<sub>2D</sub>(·)代表2D的线性变换,得到的<img file="FDA0000720190820000021.GIF" wi="154" he="67" />为离散余弦变换系数,p和q分别为方块内的横纵坐标索引,<img file="FDA0000720190820000022.GIF" wi="121" he="74" />和<img file="FDA0000720190820000023.GIF" wi="114" he="72" />分别代表在空间域和变换域与参考块P<sub>i</sub>相似的集合,τ<sub>spatial</sub>和τ<sub>trans</sub>分别代表空间域和变换域判断相似的阈值,{(x,y)<sub>spatial</sub>}和{(x,y)<sub>trans</sub>}分别为记录下的位置集合;步骤(4).分别将步骤(3)堆叠后的组进行3D变换,获得多维度稀疏的变换域信息;具体方法为:3D变换分为针对每一个图像块的2D对角变换和组堆叠纵方向上的1D变换;2D变换使用步骤(3)中的离散余弦变换,1D变换使用Walsh‑Hadamard变换:<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>T</mi><mrow><mn>1</mn><mi>D</mi></mrow></msub><mrow><mo>(</mo><msub><mi>y</mi><mi>n</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>stack</mi></msub></mfrac><mi>&Sigma;</mi><msub><mi>y</mi><mi>i</mi></msub><mi>WAL</mi><mrow><mo>(</mo><mi>n</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000720190820000024.GIF" wi="622" he="131" /></maths><maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><mi>WAL</mi><mo>=</mo><mfenced open='|' close='|'><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000720190820000025.GIF" wi="1623" he="610" /></maths>其中,T<sub>1D</sub>(·)为3D堆叠块的堆叠方向的1D变换,y<sub>n</sub>是堆叠方向的块序列,N<sub>stack</sub>为堆叠方向的块个数,WAL为Walsh函数,分别为矩阵中的每行或每列;对角变换是为了保证2D变换后信息的稀疏性;由于不限定变换形式,所以记每组空域相似块变换后的变换域谱为<img file="FDA0000720190820000026.GIF" wi="105" he="74" />每组变换域相似块变换后的变换域谱为<img file="FDA0000720190820000027.GIF" wi="106" he="74" />步骤(5).将步骤(4)得到的变换域谱<img file="FDA0000720190820000028.GIF" wi="76" he="76" />和<img file="FDA0000720190820000029.GIF" wi="82" he="73" />分别做直方图统计,获取统计结果的一阶矩、二阶矩和三阶矩作为变换域特征;<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msubsup><mi>&mu;</mi><mi>n</mi><mo>&prime;</mo></msubsup><mo>=</mo><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mo>&infin;</mo></munderover><msup><mrow><mo>(</mo><mi>x</mi><mo>-</mo><mi>c</mi><mo>)</mo></mrow><mi>n</mi></msup><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>dx</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000720190820000031.GIF" wi="1385" he="148" /></maths>其中,f(x)为直方图统计结果中的概率密度函数,n分别取1、2、3使μ′<sub>n</sub>代表一、二、三阶矩,c为相对值,通常一阶矩计算中c为0,其余为一阶矩;步骤(6).利用最小二乘法的经验公式做每组块位置的线性拟合,并求出相关系数;<maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><mfenced open='' close=''><mtable><mtr><mtd><mi>a</mi><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><mover><mi>y</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></mrow></mfrac><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>x</mi><mi>i</mi></msub><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><mi>n</mi><mover><mi>xy</mi><mo>&OverBar;</mo></mover></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msubsup><mi>x</mi><mi>i</mi><mn>2</mn></msubsup><mo>-</mo><mi>n</mi><msup><mover><mi>x</mi><mo>&OverBar;</mo></mover><mn>2</mn></msup></mrow></mfrac></mtd></mtr><mtr><mtd><mi>b</mi><mo>=</mo><mover><mi>y</mi><mo>&OverBar;</mo></mover><mo>-</mo><mi>a</mi><mover><mi>x</mi><mo>&OverBar;</mo></mover></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000720190820000033.GIF" wi="1614" he="348" /></maths><maths num="0010" id="cmaths0010"><math><![CDATA[<mrow><mi>r</mi><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><mover><mi>y</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow></mrow><mrow><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>&CenterDot;</mo><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><mover><mi>y</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000720190820000034.GIF" wi="1650" he="276" /></maths>(x,y)∈{(x,y)<sub>spatial</sub>}或{(x,y)<sub>trans</sub>}其中,a和b代表线性拟合成y=ax+b直线中的系数,x和y分别代表记录位置的横纵坐标,r代表相关系数;<img file="FDA0000720190820000035.GIF" wi="49" he="73" />和<img file="FDA0000720190820000036.GIF" wi="48" he="73" />分别为x和y的均值,n为每组块的总数;步骤(7).分别将空域和变换域提取出的特征构成特征向量,利用支持向量机和已有的数据库中的部分数据,进行训练,利用剩余数据进行交叉验证,从而得到图像质量分数;V=[μ′<sub>1spatial</sub>,μ′<sub>2spatial</sub>,μ′<sub>3spatial</sub>,r<sub>spatial</sub>,μ′<sub>1trans</sub>,μ′<sub>2trans</sub>,μ′<sub>3trans</sub>,r<sub>trans</sub>]为特征向量,下标spatial和trans分别代表空域和变换域特征。
地址 310027 浙江省杭州市西湖区浙大路38号