发明名称 面向向量处理器的去块滤波向量化实现方法
摘要 一种面向向量处理器的去块滤波向量化实现方法,其步骤为:S1:数据准备;输入n×m的被滤波视频数据块到向量存储体中,并进行系向量化;S2:水平滤波操作;S3:结果存储;根据步骤S2的结果为每个PE选择出(p3,p2,p1,p0,q0,q1,q2,q3)的最终结果以及p3和q3的值(p3,p2′,p1′,p0′,q0′,q1′,q2′,q3),存入矩阵寄存器文件;S4:重复步骤S2和步骤S3,直到水平方向所有边界滤波完毕;S5:垂直滤波;S6:结果存储;根据步骤S5的结果为每个PE选择出(p3,p2,p1,p0,q0,q1,q2,q3)的最终结果以及p3和q3的值(p3,p2′,p1′,p0′,q0′,q1′,q2′,q3),直接存入向量存储体;S7:重复步骤5和步骤6,直到垂直方向所有边界滤波完毕。本发明具有能够高效计算、充分发挥向量处理器多PE协作、缩短运算时间等优点。
申请公布号 CN105828071A 申请公布日期 2016.08.03
申请号 CN201610194300.7 申请日期 2016.03.31
申请人 中国人民解放军国防科学技术大学 发明人 陈胜刚;万江华;刘胜;王耀华;陈小文;刘仲;陈海燕
分类号 H04N19/117(2014.01)I;H04N19/124(2014.01)I;H04N19/436(2014.01)I 主分类号 H04N19/117(2014.01)I
代理机构 湖南兆弘专利事务所 43008 代理人 周长清
主权项 一种面向向量处理器的去块滤波向量化实现方法,其特征在于,步骤为:S1:数据准备;输入n×m的被滤波视频数据块到向量存储体中,并进行系向量化;S2:水平滤波操作;选择当前需要滤波的水平边界,每个PE从向量存储体中读取需要滤波的图像数据(p3,p2,p1,p0,q0,q1,q2,q3);使用图像数据(p3,p2,p1,p0,q0,q1,q2,q3)和常量计算判决条件,并存储在向量条件寄存器中;根据去块效应滤波算法的规则计算(p3,p2,p1,p0,q0,q1,q2,q3)的所有结果,分别存入局部向量寄存器中;S3:结果存储;根据步骤S2的结果为每个PE选择出(p3,p2,p1,p0,q0,q1,q2,q3)的最终结果以及p3和q3的值(p3,p2′,p1′,p0′,q0′,q1′,q2′,q3),存入矩阵寄存器文件;S4:重复步骤S2和步骤S3,直到水平方向所有边界滤波完毕;S5:垂直滤波;选择当前需要滤波的边界,每个PE从矩阵寄存器文件中读取需要滤波的图像数据(p3,p2,p1,p0,q0,q1,q2,q3),使用矩阵寄存器文件中经过了水平滤波的数据作为原始数据,选择垂直方向的图像数据(p3,p2,p1,p0,q0,q1,q2,q3)和常量计算判决条件,并存储在向量条件寄存器中;根据去块效应滤波算法的规则计算(p3,p2,p1,p0,q0,q1,q2,q3)的所有结果,分别存入局部向量寄存器中;S6:结果存储;根据步骤S5的结果为每个PE选择出(p3,p2,p1,p0,q0,q1,q2,q3)的最终结果以及p3和q3的值(p3,p2′,p1′,p0′,q0′,q1′,q2′,q3),直接存入向量存储体;S7:重复步骤5和步骤6,直到垂直方向所有边界滤波完毕。
地址 410073 湖南省长沙市开福区砚瓦池正街47号中国人民解放军国防科学技术大学计算机学院微电子与微处理器研究所