发明名称 一种基于稀疏表示的重定位图像质量客观评价方法
摘要 本发明公开了一种基于稀疏表示的重定位图像质量客观评价方法,其获取原始图像和重定位图像各自对应的关键点特征矢量集合和显著块特征矢量集合;然后对两个关键点特征矢量集合进行字典训练得到各自对应的结构字典表;并对两个显著块特征矢量集合进行字典训练得到各自对应的显著字典表;接着获取重定位图像相对于原始图像的结构相似度和显著相似度,及原始图像相对于重定位图像的结构相似度和显著相似度;再根据结构相似度和显著相似度得到重定位图像的质量矢量;最后利用支持向量回归技术,根据重定位图像的质量矢量和平均主观评分均值,获取重定位图像的客观质量评价预测值;优点是能够有效地提高客观评价结果与主观感知之间的相关性。
申请公布号 CN106162162A 申请公布日期 2016.11.23
申请号 CN201610629107.1 申请日期 2016.08.01
申请人 宁波大学 发明人 姜求平;邵枫;李福
分类号 H04N17/00(2006.01)I;H04N1/00(2006.01)I 主分类号 H04N17/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 一种基于稀疏表示的重定位图像质量客观评价方法,其特征在于包括以下步骤:①令I<sub>org</sub>表示原始图像,令I<sub>ret</sub>表示I<sub>org</sub>对应的重定位图像;②采用尺度不变特征变换对I<sub>org</sub>进行描述,得到I<sub>org</sub>中的每个关键点的描述,然后将I<sub>org</sub>中的所有关键点的描述组成反映I<sub>org</sub>几何结构信息的关键点特征矢量集合,记为G<sub>O</sub>,<img file="FDA0001066530870000011.GIF" wi="486" he="86" />并采用基于语义的显著提取方法提取I<sub>org</sub>的显著图,然后将I<sub>org</sub>的显著图划分成互不重叠的尺寸大小为8×8的显著块,接着从I<sub>org</sub>中的所有显著块中选取部分显著块,之后获取选取的每个显著块的特征矢量,再将选取的所有显著块的特征矢量组成反映I<sub>org</sub>显著语义信息的显著块特征矢量集合,记为S<sub>O</sub>,<img file="FDA0001066530870000012.GIF" wi="478" he="86" />其中,I<sub>org</sub>中的每个关键点的描述为该关键点的方向直方图组成的特征矢量,<img file="FDA0001066530870000013.GIF" wi="69" he="71" />表示I<sub>org</sub>中的第i<sub>1</sub>个关键点的描述,<img file="FDA0001066530870000014.GIF" wi="70" he="71" />为I<sub>org</sub>中的第i<sub>1</sub>个关键点的方向直方图组成的特征矢量,<img file="FDA0001066530870000015.GIF" wi="68" he="77" />的维数为128×1,M<sub>1</sub>表示I<sub>org</sub>中的关键点的总个数,<img file="FDA0001066530870000016.GIF" wi="74" he="77" />表示从I<sub>org</sub>中选取的第j<sub>1</sub>个显著块的特征矢量,<img file="FDA0001066530870000017.GIF" wi="73" he="78" />的维数为192×1,N<sub>1</sub>表示从I<sub>org</sub>中的所有显著块中选取的显著块的总个数;同样,采用尺度不变特征变换对I<sub>ret</sub>进行描述,得到I<sub>ret</sub>中的每个关键点的描述,然后将I<sub>ret</sub>中的所有关键点的描述组成反映I<sub>ret</sub>几何结构信息的关键点特征矢量集合,记为G<sub>R</sub>,<img file="FDA0001066530870000018.GIF" wi="501" he="85" />并采用基于语义的显著提取方法提取I<sub>ret</sub>的显著图,然后将I<sub>ret</sub>的显著图划分成互不重叠的尺寸大小为8×8的显著块,接着从I<sub>ret</sub>中的所有显著块中选取部分显著块,之后获取选取的每个显著块的特征矢量,再将选取的所有显著块的特征矢量组成反映I<sub>ret</sub>显著语义信息的显著块特征矢量集合,记为S<sub>R</sub>,<img file="FDA0001066530870000019.GIF" wi="492" he="86" />其中,I<sub>ret</sub>中的每个关键点的描述为该关键点的方向直方图组成的特征矢量,<img file="FDA00010665308700000110.GIF" wi="68" he="71" />表示I<sub>ret</sub>中的第i<sub>2</sub>个关键点的描述,<img file="FDA00010665308700000111.GIF" wi="65" he="77" />为I<sub>ret</sub>中的第i<sub>2</sub>个关键点的方向直方图组成的特征矢量,<img file="FDA0001066530870000021.GIF" wi="77" he="77" />的维数为128×1,M<sub>2</sub>表示I<sub>ret</sub>中的关键点的总个数,<img file="FDA0001066530870000022.GIF" wi="89" he="73" />表示从I<sub>ret</sub>中选取的第j<sub>2</sub>个显著块的特征矢量,<img file="FDA0001066530870000023.GIF" wi="85" he="79" />的维数为192×1,N<sub>2</sub>表示从I<sub>ret</sub>中的所有显著块中选取的显著块的总个数;③采用最小角回归方法对G<sub>O</sub>进行字典训练操作,构造得到I<sub>org</sub>的结构字典表,记为<img file="FDA0001066530870000024.GIF" wi="93" he="63" /><img file="FDA0001066530870000025.GIF" wi="68" he="63" />是采用最小角回归方法求解<img file="FDA0001066530870000026.GIF" wi="535" he="238" />得到的;并采用最小角回归方法对S<sub>O</sub>进行字典训练操作,构造得到Io<sub>rg</sub>的显著字典表,记为<img file="FDA0001066530870000027.GIF" wi="91" he="70" /><img file="FDA0001066530870000028.GIF" wi="69" he="68" />是采用最小角回归方法求解<img file="FDA0001066530870000029.GIF" wi="550" he="236" />得到的;其中,<img file="FDA00010665308700000210.GIF" wi="68" he="70" />的维数为128×K<sub>1</sub>,K<sub>1</sub>为设定的字典个数,K<sub>1</sub>≥1,min{}为取最小值函数,符号“|| ||<sub>2</sub>”为求取矩阵的2‑范数符号,符号“|| ||<sub>0</sub>”为求取矩阵的0‑范数符号,<img file="FDA00010665308700000211.GIF" wi="85" he="74" />表示<img file="FDA00010665308700000212.GIF" wi="71" he="77" />的基于<img file="FDA00010665308700000213.GIF" wi="67" he="70" />的稀疏系数矩阵,<img file="FDA00010665308700000214.GIF" wi="78" he="73" />的维数为K<sub>1</sub>×1,τ<sub>1</sub>为设定的稀疏度,<img file="FDA00010665308700000215.GIF" wi="64" he="70" />的维数为192×L<sub>1</sub>,L<sub>1</sub>为设定的字典个数,L<sub>1</sub>≥1,<img file="FDA00010665308700000216.GIF" wi="85" he="71" />表示<img file="FDA00010665308700000217.GIF" wi="78" he="71" />的基于<img file="FDA00010665308700000218.GIF" wi="66" he="70" />的稀疏系数矩阵,<img file="FDA00010665308700000219.GIF" wi="86" he="79" />的维数为L<sub>1</sub>×1;同样,采用最小角回归方法对G<sub>R</sub>进行字典训练操作,构造得到I<sub>ret</sub>的结构字典表,记为<img file="FDA00010665308700000220.GIF" wi="88" he="71" /><img file="FDA00010665308700000221.GIF" wi="68" he="69" />是采用最小角回归方法求解<img file="FDA00010665308700000222.GIF" wi="531" he="237" />得到的;并采用最小角回归方法对S<sub>R</sub>进行字典训练操作,构造得到I<sub>ret</sub>的显著字典表,记为<img file="FDA00010665308700000223.GIF" wi="93" he="63" /><img file="FDA00010665308700000224.GIF" wi="69" he="71" />是采用最小角回归方法求解<img file="FDA00010665308700000225.GIF" wi="558" he="239" />得到的;其中,<img file="FDA00010665308700000226.GIF" wi="66" he="71" />的维数为128×K<sub>2</sub>,K<sub>2</sub>为设定的字典个数,K<sub>2</sub>≥1,<img file="FDA00010665308700000227.GIF" wi="83" he="78" />表示<img file="FDA00010665308700000228.GIF" wi="75" he="78" />的基于<img file="FDA00010665308700000229.GIF" wi="66" he="70" />的稀疏系数矩阵,<img file="FDA00010665308700000230.GIF" wi="82" he="79" />的维数为K<sub>2</sub>×1,τ<sub>2</sub>为设定的稀疏度,<img file="FDA00010665308700000231.GIF" wi="68" he="70" />的维数为192×L<sub>2</sub>,L<sub>2</sub>为设定的字典个数,L<sub>2</sub>≥1,<img file="FDA00010665308700000232.GIF" wi="86" he="79" />表示<img file="FDA00010665308700000233.GIF" wi="77" he="77" />的基于<img file="FDA00010665308700000234.GIF" wi="67" he="63" />的稀疏系数矩阵,<img file="FDA00010665308700000235.GIF" wi="91" he="71" />的维数为L<sub>2</sub>×1;④根据<img file="FDA0001066530870000031.GIF" wi="61" he="70" />和<img file="FDA0001066530870000032.GIF" wi="99" he="70" />计算I<sub>ret</sub>相对于I<sub>org</sub>的结构相似度,记为<img file="FDA0001066530870000033.GIF" wi="86" he="71" />并根据<img file="FDA0001066530870000034.GIF" wi="64" he="71" />和<img file="FDA0001066530870000035.GIF" wi="89" he="71" />计算I<sub>ret</sub>相对于I<sub>org</sub>的显著相似度,记为<img file="FDA0001066530870000036.GIF" wi="83" he="70" />同样,根据<img file="FDA0001066530870000037.GIF" wi="64" he="63" />和<img file="FDA0001066530870000038.GIF" wi="89" he="62" />计算I<sub>org</sub>相对于I<sub>ret</sub>的结构相似度,记为<img file="FDA0001066530870000039.GIF" wi="89" he="63" />并根据<img file="FDA00010665308700000310.GIF" wi="61" he="63" />和<img file="FDA00010665308700000311.GIF" wi="87" he="63" />计算I<sub>org</sub>相对于I<sub>ret</sub>的显著相似度,记为<img file="FDA00010665308700000312.GIF" wi="83" he="63" />⑤根据<img file="FDA00010665308700000313.GIF" wi="299" he="69" />和<img file="FDA00010665308700000314.GIF" wi="91" he="63" />获取I<sub>ret</sub>的质量矢量,记为Q,<img file="FDA00010665308700000315.GIF" wi="461" he="87" />其中,Q的维数为1×4,符号“[]”为矢量表示符号;⑥将P幅重定位图像构成重定位图像库,将重定位图像库中的第p幅重定位图像的平均主观评分均值记为MOS<sub>p</sub>;接着按照步骤①至步骤⑤获取I<sub>ret</sub>的质量矢量Q的操作,以相同的方式获取重定位图像库中的每幅重定位图像的质量矢量,将重定位图像库中的第p幅重定位图像的质量矢量记为Q<sub>p</sub>;其中,P&gt;1,1≤p≤P,MOS<sub>p</sub>∈[1,5],Q<sub>p</sub>的维数为1×4;⑦从重定位图像库中随机选择T幅重定位图像构成训练集,将重定位图像库中剩余的P‑T幅重定位图像构成测试集,并令m表示迭代的次数,其中,1&lt;T&lt;P,m的初始值为0;⑧将训练集中的所有重定位图像各自的质量矢量和平均主观评分均值构成训练样本数据集合;接着采用支持向量回归作为机器学习的方法,对训练样本数据集合中的所有质量矢量进行训练,使得经过训练得到的回归函数值与平均主观评分均值之间的误差最小,拟合得到最优的支持向量回归训练模型,记为f(Q<sub>inp</sub>);之后根据最优的支持向量回归训练模型,对测试集中的每幅重定位图像的质量矢量进行测试,预测得到测试集中的每幅重定位图像的客观质量评价预测值,将测试集中的第n幅重定位图像的客观质量评价预测值记为Quality<sub>n</sub>,Quality<sub>n</sub>=f(Q<sub>n</sub>);然后令m=m+1;再执行步骤⑨;其中,f()为函数表示形式,Q<sub>inp</sub>表示最优的支持向量回归训练模型的输入矢量,1≤n≤P‑T,Q<sub>n</sub>表示测试集中的第n幅重定位图像的质量矢量,m=m+1中的“=”为赋值符号;⑨判断m&lt;M是否成立,如果成立,则重新随机分配构成训练集的T幅重定位图像和构成测试集的P‑T幅重定位图像,然后返回步骤⑧继续执行;否则,计算重定位图像库中的每幅重定位图像的多个客观质量评价预测值的平均值,并将计算得到的平均值作为对应那幅重定位图像的最终的客观质量评价预测值;其中,M表示设定的总迭代次数,M&gt;100。
地址 315211 浙江省宁波市江北区风华路818号