发明名称 一种基于堆栈式去噪自编码机的显著性物体检测方法
摘要 本发明涉及一种基于堆栈式去噪自编码机的显著性物体检测方法,首先利用去噪自编码机对位于图像周边的图块进行建模,然后将训练好的模型对整幅图像中的图块进行深度特征的提取及重建,并将深度重建残余作为显著性的计算手段。最终取得更具准确性,鲁棒性的显著物体检测结果。
申请公布号 CN103955936B 申请公布日期 2017.01.25
申请号 CN201410200352.1 申请日期 2014.05.13
申请人 西北工业大学 发明人 韩军伟;张鼎文;郭雷
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 西北工业大学专利中心 61204 代理人 王鲜凯
主权项 一种基于堆栈式去噪自编码机的显著性物体检测方法,其特征在于步骤如下:步骤1在图像中提取边界图块:首先将图像下采样为P×P个像素,然后利用大小为size∈[5,20],步长为step∈[1,size]的方形滑动窗口在下采样后的图像的上、左、下、右四个边界中提取图块,并将每个图块内的像素值构成的向量作为该图块的特征,生成四个训练集合X<sub>top</sub>,X<sub>left</sub>,X<sub>down</sub>,X<sub>right</sub>;步骤2训练基于图像边界的堆栈式去噪自编码机;采用节点数分别为H<sub>1</sub>∈[20,500],H<sub>2</sub>∈[20,500]的两层结构的堆栈式去噪自编码机(SDAE),对四个集合X<sub>top</sub>,X<sub>left</sub>,X<sub>down</sub>,X<sub>right</sub>进行训练,得到四个基于图像边界的堆栈式去噪自编码机SDAE<sub>top</sub>,SDAE<sub>left</sub>,SDAE<sub>down</sub>和SDAE<sub>right</sub>;步骤3计算深度残余:采用大小为size∈[5,20],步长为step∈[1,size]的方形滑动窗口在下采样后的图像中提取图块,并将图块内的像素值构成的向量作为该图块的特征,生成堆栈式去噪自编码机的输入集合X={x<sub>j</sub>},其中j∈[1,N],N为整幅图像中提取的图块数;将集合X={x<sub>j</sub>}中的每一个输入样本x<sub>j</sub>输入SDAE<sub>top</sub>中,计算输入样本x<sub>j</sub>的上边界深度残余<img file="FDA0001075999790000011.GIF" wi="458" he="71" />其中<img file="FDA0001075999790000012.GIF" wi="93" he="71" />为x<sub>j</sub>在SDAE<sub>top</sub>中第一隐层的激活向量,<img file="FDA0001075999790000013.GIF" wi="86" he="71" />为x<sub>j</sub>在SDAE<sub>top</sub>中第二重构层的激活向量,d表示深度;将集合X={x<sub>j</sub>}中的每一个输入样本x<sub>j</sub>输入SDAE<sub>left</sub>中,计算输入样本x<sub>j</sub>的左边界深度残余<img file="FDA0001075999790000014.GIF" wi="458" he="71" />其中<img file="FDA0001075999790000015.GIF" wi="91" he="71" />为x<sub>j</sub>在SDAE<sub>left</sub>中第一隐层的激活向量,<img file="FDA0001075999790000016.GIF" wi="85" he="71" />为x<sub>j</sub>在SDAE<sub>left</sub>中第二重构层的激活向量,d表示深度;将集合X={x<sub>j</sub>}中的每一个输入样本x<sub>j</sub>输入SDAE<sub>down</sub>中,计算输入样本x<sub>j</sub>的下边界深度残余<img file="FDA0001075999790000017.GIF" wi="587" he="72" />其中<img file="FDA0001075999790000018.GIF" wi="136" he="71" />为x<sub>j</sub>在SDAE<sub>down</sub>中第一隐层的激活向量,<img file="FDA0001075999790000019.GIF" wi="126" he="72" />为x<sub>j</sub>在SDAE<sub>down</sub>中第二重构层的激活向量,d表示深度;将集合X={x<sub>j</sub>}中的每一个输入样本x<sub>j</sub>输入SDAE<sub>right</sub>中,计算输入样本x<sub>j</sub>的右边界深度残余<img file="FDA0001075999790000021.GIF" wi="515" he="71" />其中<img file="FDA0001075999790000022.GIF" wi="120" he="71" />为x<sub>j</sub>在SDAE<sub>right</sub>中第一隐层的激活向量,<img file="FDA0001075999790000023.GIF" wi="110" he="71" />为x<sub>j</sub>在SDAE<sub>right</sub>中第二重构层的激活向量,d表示深度;步骤4合并生成深度残余图:将步骤3中的每一个输入样本x<sub>j</sub>合并得到四个边界的深度残余:<img file="FDA0001075999790000024.GIF" wi="693" he="116" />将合并后的深度残余作为与其相对应的输入样本的灰度值生成与下采样后图像对应的灰度图,将这个灰度图上采样到原始图片的大小生成图像的深度残余图;步骤5基于超像素的区域平滑:根据超像素分割理论,将原始图像分割成互不重叠的超像素区域R<sub>q</sub>,q∈[1,Q],其中Q为超像素区域总数;则每一个超像素区域R<sub>q</sub>的显著值为该超像素区域内所有像素点上深度残余的均值;将所有超像素区域的显著值线性映射到[0,1]范围内就得到了最终的显著物体检测结果。
地址 710072 陕西省西安市友谊西路127号