发明名称 |
基于CUDA的快速双边滤波方法 |
摘要 |
本发明公开了一种基于CUDA的快速双边滤波方法,主要解决标准双边滤波算法在运算速度上的不足。本方法将原始双边滤波算法做并行化处理,然后将图像数据从主机内存中复制到GPU的内存中,通过CUDA(Compute Unified Device Architecture)统一计算设备架构来调用GPU(Graphic Processing Unit)图形处理器进行滤波计算,对于所有像素点的计算都是并行执行的。与现有的双边滤波算法相比,本发明能够在保持双边滤波去噪性能不变的情况下,大幅提高双边滤波的计算速度,使之能够满足实时处理的要求。 |
申请公布号 |
CN104732490A |
申请公布日期 |
2015.06.24 |
申请号 |
CN201410727796.0 |
申请日期 |
2014.12.03 |
申请人 |
南京理工大学 |
发明人 |
陈强;曾炫杰;孙权森;谭海鹏;朱文斌 |
分类号 |
G06T5/00(2006.01)I;G06T1/20(2006.01)I |
主分类号 |
G06T5/00(2006.01)I |
代理机构 |
南京理工大学专利中心 32203 |
代理人 |
朱显国 |
主权项 |
一种基于CUDA的快速双边滤波方法,其特征在于包括以下步骤:步骤1、计算空域高斯模板,模板大小定义为:(2N+1)×(2N+1),其中N为自然数;步骤2、由CPU获取图像数据,并将数据保存在主机Host内存中;步骤3、申请GPU内存空间,用于保存实现滤波方法所需的空域高斯模板、图像数据和结果图像数据;步骤4、将Host内存中的图像数据和高斯模板数据复制到GPU的内存中;步骤5、计算所需要的Thread线程数,然后设定计算所需要的Block线程块数;步骤6、启动CUDA多线程,对图像数据做并行卷积模板运算,卷积模板包括空域高斯模板和值域高斯模板;步骤7、将步骤6的计算结果从GPU中复制到Host内存中。 |
地址 |
210094 江苏省南京市孝陵卫200号 |