发明名称 一种并行滤波方法及相应的装置
摘要 本发明公开了一种并行滤波方法及相应的装置。该装置包括:多粒度存储器、数据缓存装置、系数缓冲广播装置、向量运算装置和命令队列装置,多粒度存储器用于存储待滤波数据和滤波系数以及滤波结果数据;数据缓存装置用于缓存、读取和更新取出的待滤波数据;系数缓冲广播装置用于缓存和广播取出的滤波系数;命令队列装置用于存放并输出并行滤波运算操作命令;向量运算装置用于基于待滤波数据和输出系数数据进行向量运算,并将运算结果写入多粒度存储器中。本发明还公开了一种并行滤波方法。本发明滤波速度快、减少了访存次数、提高了数据的使用效率、降低了功耗、适用范围广。
申请公布号 CN103227622B 申请公布日期 2016.07.06
申请号 CN201310139302.2 申请日期 2013.04.19
申请人 中国科学院自动化研究所 发明人 王东琳;尹磊祖;杨勇勇;谢少林;汪涛
分类号 H03H17/02(2006.01)I 主分类号 H03H17/02(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 一种并行滤波装置,其特征在于,该装置包括:多粒度存储器(10)、数据缓存装置(20)、系数缓冲广播装置(30)、向量运算装置(40)和命令队列装置(50),其中:所述多粒度存储器(10)用于存储分别从待滤波数据矩阵和滤波系数矩阵中读取的、参与并行滤波运算的待滤波数据和滤波系数,以及滤波之后得到的滤波结果数据;所述多粒度存储器(10)包括:多粒度待滤波数据存储单元(101),多粒度滤波系数存储单元(102),多粒度滤波结果存储单元(103);所述多粒度待滤波数据存储单元(101)、多粒度滤波系数存储单元(102)的读写位宽与所述向量运算装置(40)的运算尺寸一致,记为BS,也就是说,所述向量运算装置(40)同一时间可以进行BS个运算,同时可以将BS个运算结果一次性地写入多粒度待滤波数据存储单元(101)和多粒度滤波系数存储单元(102)中;所述数据缓存装置(20),用于缓存从所述多粒度待滤波数据存储单元(101)中取出的待滤波数据,并对待滤波数据进行读取和更新;所述数据缓存装置(20)包括数据缓存体(201)和数据缓冲控制单元(202);所述系数缓冲广播装置(30),用于缓存从所述多粒度滤波系数存储单元(102)中取出的滤波系数,并对滤波系数进行广播,即将所述滤波系数复制BS份,得到宽度为BS个数据元素的输出系数数据(3001);所述系数缓冲广播装置(30)包括系数缓冲区实体(301)和多个系数缓冲区控制单元:读控制逻辑单元(302),初始化逻辑单元(303)和更新逻辑单元(304);所述命令队列装置(50)用于存放并向所述向量运算装置(40)输出并行滤波运算的操作命令队列;所述向量运算装置(40)用于基于从所述数据缓存装置(20)中读取得到的待滤波数据和从所述系数缓冲广播装置(30)中读取得到的输出系数数据(3001)进行向量运算,并将运算结果写入所述多粒度滤波结果存储单元(103)中;所述系数缓冲区实体(301)用于缓存所述滤波系数矩阵中的滤波系数;所述读控制逻辑单元(302)用于对所述系数缓冲区实体(301)的读操作进行控制;所述初始化逻辑单元(303)用于在所述系数缓冲广播装置(30)的输入信号中的‑初始化开始信号(3007)有效时,将所述系数缓冲区实体(301)初始化,即从所述多粒度滤波系数存储单元(102)中取出相应的滤波系数到所述系数缓冲区实体(301)中;所述更新逻辑单元(304)用于当所述缓冲区实体(301)不足以放下所述多粒度滤波系数存储单元(102)中的所有滤波系数时,从所述多粒度滤波系数存储单元(102)中取出多余的滤波系数存到所述缓冲区实体(301)中。
地址 100190 北京市海淀区中关村东路95号