基于离散余弦变换和稀疏表示的无参考图像质量评价方法,申请号CN201410695579.8-传众专利搜索

发明名称	基于离散余弦变换和稀疏表示的无参考图像质量评价方法
摘要	本发明公开了一种基于离散余弦变换和稀疏表示的无参考图像质量评价方法，主要解决现有技术对无参考图像质量评价不准确的问题。其实现步骤是：输入一副灰度图像，对其进行离散余弦变换并提取自然场景统计特征；提取一系列不同失真类型和不同内容的图像的自然场景统计特征，结合平均主观差异分数构建原始特征字典；对原始特征字典进行聚类，根据测试图像特征与原始特征字典中各类的近似程度自适应选择原子组成稀疏表示字典；利用稀疏表示在特征空间张成测试图像特征并计算稀疏表示系数，结合稀疏表示字典中的主观评价值进行线性加权求和，得到图像质量测度。本发明与主观评价结果具有较好的一致性，适用于对各种失真类型图像的质量评价。
申请公布号	CN104376565A	申请公布日期	2015.02.25
申请号	CN201410695579.8	申请日期	2014.11.26
申请人	西安电子科技大学	发明人	张小华;焦李成;温阳;王爽;钟桦;田小林;朱虎明
分类号	G06T7/00(2006.01)I	主分类号	G06T7/00(2006.01)I
代理机构	陕西电子工业专利中心 61205	代理人	王品华;朱红星
主权项	一种基于离散余弦变换和稀疏表示的无参考图像质量评价方法，包括如下步骤：(1)读入一幅灰度图像I，对其进行离散余弦变换，提取一系列与主观感知相关联的自然场景统计特征f；(2)组建训练图像的原始特征字典；(2a)重复步骤(1)，提取n副训练图像的自然场景统计特征，并构成特征矩阵F，F＝[f<sub>1</sub>,f<sub>2</sub>,...,f<sub>i</sub>,...,f<sub>n</sub>]，其中f<sub>i</sub>为第n副训练图像的自然场景统计特征，i＝1,2,...,n；(2b)整合n副训练图像的平均主观差异分数，并构成质量向量M，M＝[m<sub>1</sub>,m<sub>2</sub>,...,m<sub>i</sub>,...,m<sub>n</sub>]，其中m<sub>i</sub>为第n副训练图像的平均主观差异分数，i＝1,2,...,n；(2c)将质量向量M和特征矩阵F进行对应结合，构建原始特征字典D：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>D</mi><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mi>F</mi></mtd></mtr><mtr><mtd><mi>M</mi></mtd></mtr></mtable></mfenced><mo>=</mo><mo>[</mo><mover><msub><mi>f</mi><mn>1</mn></msub><mo>&OverBar;</mo></mover><mo>,</mo><mover><msub><mi>f</mi><mn>2</mn></msub><mo>&OverBar;</mo></mover><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mover><msub><mi>f</mi><mi>i</mi></msub><mo>&OverBar;</mo></mover><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mover><msub><mi>f</mi><mi>n</mi></msub><mo>&OverBar;</mo></mover><mo>]</mo><mo>,</mo></mrow>]]></math><img file="FDA0000617337490000011.GIF" wi="688" he="158" /></maths>其中<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mover><msub><mi>f</mi><mi>i</mi></msub><mo>&OverBar;</mo></mover><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>f</mi><mi>i</mi></msub></mtd></mtr><mtr><mtd><msub><mi>m</mi><mi>i</mi></msub></mtd></mtr></mtable></mfenced><mo>,</mo><mi>i</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>n</mi><mo>;</mo></mrow>]]></math><img file="FDA0000617337490000012.GIF" wi="487" he="158" /></maths>(2d)用K‑means算法将原始特征字典D聚为H类，H类中第k类聚类中心为C<sub>k</sub>，其中<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>C</mi><mi>k</mi></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>Fc</mi><mi>k</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Mc</mi><mi>k</mi></msub></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000617337490000013.GIF" wi="274" he="158" /></maths>Fc<sub>k</sub>为特征聚类中心，Mc<sub>k</sub>为质量聚类中心，k＝1,2...H。(3)读入一副测试图像I'，重复步骤(1)，提取测试图像I'的自然场景统计特征f'；(4)计算测试图像I'的自然场景统计特征f'与原始特征字典D中第k类的特征聚类中心Fc<sub>k</sub>的欧式距离dis<sub>k</sub>，得到测试图像I'与原始特征字典D中第k类的近似程度P<sub>k</sub>，其中<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>P</mi><mi>k</mi></msub><mo>=</mo><mfrac><mrow><mn>1</mn><mo>/</mo><msub><mi>dis</mi><mi>k</mi></msub></mrow><mrow><msubsup><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>H</mi></msubsup><mn>1</mn><mo>/</mo><msub><mi>dis</mi><mi>k</mi></msub></mrow></mfrac><mo>,</mo></mrow>]]></math><img file="FDA0000617337490000014.GIF" wi="381" he="163" /></maths>k＝1,2,...,H；(5)根据近似程度P<sub>k</sub>，从原始特征字典D的第k类中选择与特征聚类中心Fc<sub>k</sub>的欧式距离最小的前N<sub>k</sub>个样本作为测试图像I'的稀疏表示原子<img file="FDA0000617337490000015.GIF" wi="112" he="83" />其中i＝1,2,...,N,k＝1,2,...,H，H类原子共同构成针对测试图像I'的稀疏表示字典D'：<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msup><mi>D</mi><mo>′</mo></msup><mo>=</mo><mo>[</mo><msub><mi>D</mi><mn>1</mn></msub><mo>,</mo><msub><mi>D</mi><mn>2</mn></msub><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>D</mi><mi>k</mi></msub><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>D</mi><mi>H</mi></msub><mo>]</mo><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msup><mi>F</mi><mo>′</mo></msup></mtd></mtr><mtr><mtd><msup><mi>M</mi><mo>′</mo></msup></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000617337490000016.GIF" wi="748" he="156" /></maths>其中<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>D</mi><mi>k</mi></msub><mo>=</mo><mo>[</mo><msubsup><mover><mi>f</mi><mo>&OverBar;</mo></mover><mn>1</mn><mi>k</mi></msubsup><mo>,</mo><msubsup><mover><mi>f</mi><mo>&OverBar;</mo></mover><mn>2</mn><mi>k</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mover><mi>f</mi><mo>&OverBar;</mo></mover><mi>i</mi><mi>k</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mover><mi>f</mi><mo>&OverBar;</mo></mover><msub><mi>N</mi><mi>k</mi></msub><mi>k</mi></msubsup><mo>]</mo><mo>,</mo><msubsup><mover><mi>f</mi><mo>&OverBar;</mo></mover><mi>i</mi><mi>k</mi></msubsup><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msubsup><mi>f</mi><mi>i</mi><mi>k</mi></msubsup></mtd></mtr><mtr><mtd><msubsup><mi>m</mi><mi>i</mi><mi>k</mi></msubsup></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000617337490000017.GIF" wi="876" he="165" /></maths><img file="FDA0000617337490000018.GIF" wi="77" he="83" />为从原始特征字典D中选择的第k类中的第i个样本的自然场景统计特征，<img file="FDA0000617337490000021.GIF" wi="71" he="78" />为第k类中的第i个样本的平均主观差异分数，i＝1,2,...,N<sub>k</sub>，N<sub>k</sub>＝δP<sub>k</sub>，k＝1,2,...,H，δ为正常数；(6)根据稀疏表示的方法求解测试图像I'的自然场景统计特征f'在特征矩阵F'下的稀疏表示系数：<img file="FDA0000617337490000022.GIF" wi="709" he="116" />其中argmin表示将使目标函数λ·\|\|α\|\|<sub>1</sub>+\|\|f'‑D′α\|\|<sub>2</sub>最小的α＝[α<sup>1</sup>,α<sup>2</sup>,...,α<sup>k</sup>,...,α<sup>H</sup>]<sup>T</sup>赋值给α<sup></sup>，<img file="FDA0000617337490000029.GIF" wi="672" he="93" />k＝1,2,...,H,i＝1,2,...,N<sub>k</sub>，R<sup>L</sup>表示L维实数空间，<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><mi>L</mi><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>H</mi></munderover><msub><mi>N</mi><mi>k</mi></msub><mo>,</mo><msub><mrow><mo>\|</mo><mo>\|</mo><mi>β</mi><mo>\|</mo><mo>\|</mo></mrow><mn>1</mn></msub><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><mi>L</mi></munderover><mo>\|</mo><msub><mi>β</mi><mi>l</mi></msub><mo>\|</mo></mrow>]]></math><img file="FDA0000617337490000023.GIF" wi="523" he="141" /></maths>表示向量β＝[β<sub>1</sub>,β<sub>2</sub>,...,β<sub>l</sub>,...,β<sub>L</sub>]<sup>T</sup>的1范数，<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msub><mrow><mo>\|</mo><mo>\|</mo><mi>β</mi><mo>\|</mo><mo>\|</mo></mrow><mn>2</mn></msub><mo>=</mo><msqrt><munderover><mi>Σ</mi><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><mi>L</mi></munderover><msubsup><mi>β</mi><mi>l</mi><mn>2</mn></msubsup></msqrt></mrow>]]></math><img file="FDA0000617337490000024.GIF" wi="295" he="157" /></maths>表示向量β的2范数，λ是用于平衡保真项和正则项的正常数，T代表转置操作；(7)根据所构建的稀疏表示计算测试图像I'的质量：<img file="FDA0000617337490000025.GIF" wi="380" he="286" />Q∈[0,100]，其中<img file="FDA0000617337490000026.GIF" wi="68" he="84" />为稀疏表示字典D'中第k类第i个原子<img file="FDA0000617337490000027.GIF" wi="66" he="82" />的质量分数，α<sub>k,i</sub>表示测试图像I'的自然场景统计特征f'在特征矩阵F'中的第k类第i个原子<img file="FDA0000617337490000028.GIF" wi="60" he="70" />的表示系数，Q为测试图像I'的最终质量测度。
地址	710071 陕西省西安市太白南路2号