发明名称 一种高效视频编码加法树并行实现方法
摘要 一种高效视频编码加法树并行实现方法涉及数字视频编解码技术领域。本发明采用二维处理元阵列结构,对亮度块分割模式的SAD值计算并行处理,有效的提升了运动估计运算效率。通过采用根据分块模式的类型选取存储该SAD值的处理元的方法,加快加法树的计算速度,提高计算效率。通过采用单PE存储4*4像素块的方式,相对于传统的像素块的存储方式(单PE存储单像素),处理单元使用的数量缩减至原来的1/16。相对于加法树串行结构的实现方法,该并行结构速度提高了近100 倍。十二种分块模式SAD值的计算均通过4*4分块模式的SAD值合并得到的,可以减少过多的计算过程,提高计算效率。
申请公布号 CN105847810A 申请公布日期 2016.08.10
申请号 CN201610062397.6 申请日期 2016.01.29
申请人 西安邮电大学 发明人 崔继兴;谢晓燕;张阿宁
分类号 H04N19/176(2014.01)I;H04N19/96(2014.01)I;H04N19/436(2014.01)I 主分类号 H04N19/176(2014.01)I
代理机构 代理人
主权项 一种高效视频编码加法树并行实现方法,基于邻接互连的二维处理元阵列,包括以下步骤:步骤1加法树模块经由缓存区1和缓存区2从外存加载64×64亮度块,并且以4×4大小的像素块按照自上到下、从左到右的存储方式存放到处理元阵列中;步骤2加法树模块经由缓存区1和缓存区2从外存读取64×64参考块,并且以4×4大小的像素块按照自上到下、从左到右的存储方式,存放到处理元阵列中;步骤3处理元阵列中的各个处理元,在获取的亮度块和参考块的基础上,同时计算4×4分块模式的SAD值SAD4×4,计算完成后存放到亮度块和参考块对应的处理元中,一共256个SAD值SAD4×4;步骤4在步骤3计算得到的SAD4×4的基础上进行剩下的十二种分块模式的SAD值的计算,并且为计算得到的分块模式的SAD值选择存储位置;其特征在于,采用根据该分块模式的类型选取存储该SAD值的处理元的方法选择分块模式的SAD值的存储位置,具体的,如果分块模式是2N×N则选取上方的处理元存储该值,如果分块模式是N×2N则选取下方的处理元存储该值,如果分块模式是2N×2N则选取右下方的处理元存储该值。
地址 710121 陕西省西安市长安区西长安街