摘要 |
一种面向向量处理器的去块滤波向量化实现方法,其步骤为:S1:数据准备;输入n×m的被滤波视频数据块到向量存储体中,并进行系向量化;S2:水平滤波操作;S3:结果存储;根据步骤S2的结果为每个PE选择出(p3,p2,p1,p0,q0,q1,q2,q3)的最终结果以及p3和q3的值(p3,p2′,p1′,p0′,q0′,q1′,q2′,q3),存入矩阵寄存器文件;S4:重复步骤S2和步骤S3,直到水平方向所有边界滤波完毕;S5:垂直滤波;S6:结果存储;根据步骤S5的结果为每个PE选择出(p3,p2,p1,p0,q0,q1,q2,q3)的最终结果以及p3和q3的值(p3,p2′,p1′,p0′,q0′,q1′,q2′,q3),直接存入向量存储体;S7:重复步骤5和步骤6,直到垂直方向所有边界滤波完毕。本发明具有能够高效计算、充分发挥向量处理器多PE协作、缩短运算时间等优点。 |
主权项 |
一种面向向量处理器的去块滤波向量化实现方法,其特征在于,步骤为:S1:数据准备;输入n×m的被滤波视频数据块到向量存储体中,并进行系向量化;S2:水平滤波操作;选择当前需要滤波的水平边界,每个PE从向量存储体中读取需要滤波的图像数据(p3,p2,p1,p0,q0,q1,q2,q3);使用图像数据(p3,p2,p1,p0,q0,q1,q2,q3)和常量计算判决条件,并存储在向量条件寄存器中;根据去块效应滤波算法的规则计算(p3,p2,p1,p0,q0,q1,q2,q3)的所有结果,分别存入局部向量寄存器中;S3:结果存储;根据步骤S2的结果为每个PE选择出(p3,p2,p1,p0,q0,q1,q2,q3)的最终结果以及p3和q3的值(p3,p2′,p1′,p0′,q0′,q1′,q2′,q3),存入矩阵寄存器文件;S4:重复步骤S2和步骤S3,直到水平方向所有边界滤波完毕;S5:垂直滤波;选择当前需要滤波的边界,每个PE从矩阵寄存器文件中读取需要滤波的图像数据(p3,p2,p1,p0,q0,q1,q2,q3),使用矩阵寄存器文件中经过了水平滤波的数据作为原始数据,选择垂直方向的图像数据(p3,p2,p1,p0,q0,q1,q2,q3)和常量计算判决条件,并存储在向量条件寄存器中;根据去块效应滤波算法的规则计算(p3,p2,p1,p0,q0,q1,q2,q3)的所有结果,分别存入局部向量寄存器中;S6:结果存储;根据步骤S5的结果为每个PE选择出(p3,p2,p1,p0,q0,q1,q2,q3)的最终结果以及p3和q3的值(p3,p2′,p1′,p0′,q0′,q1′,q2′,q3),直接存入向量存储体;S7:重复步骤5和步骤6,直到垂直方向所有边界滤波完毕。 |