主权项 |
一种基于稀疏表示的近似重复图像检测方法,该方法基于hadoop分布式计算框架提出,该检测方法包括如下步骤,获取图像集I中所有图像的IDF加权稀疏编码g′,其中I=(I<sub>1</sub>,I<sub>2</sub>,...,I<sub>i</sub>,...,I<sub>w</sub>,…,I<sub>z</sub>,…,I<sub>R</sub>),I<sub>i</sub>的IDF加权稀疏编码为g<sub>i</sub>′,g<sub>i</sub>′∈g′,i为大于等于1的自然数,w为大于i的自然数,z为大于w的自然数,R为大于z的自然数,其特征在于,方法还包括:(1)提取图像I<sub>i</sub>的IDF加权稀疏编码g<sub>i</sub>′中的非零元素;g<sub>ik</sub>′∈g<sub>i</sub>′,k为大于等于1的自然数,g<sub>i</sub>′内的非零元素为(g<sub>iu</sub>′,...,g<sub>iv</sub>′),设非零元素为m个,m为大于等于1的自然数,m≤k,g<sub>iu</sub>′≠0,g<sub>iv</sub>′≠0,u为大于等于1的自然数,v大于等于1的自然数,k>v>u;(2)建立k个组,分别命名为:<img file="FDA0001176093150000011.GIF" wi="259" he="615" />其中,<img file="FDA0001176093150000012.GIF" wi="161" he="527" />为空矩阵;(3)利用(式1)的矩阵变换,将图像I<sub>i</sub>的IDF加权稀疏编码g<sub>i</sub>′分别散列到非零元素的下标(u,...,v)对应的m个组里;<img file="FDA0001176093150000013.GIF" wi="1454" he="622" />(4)利用<img file="FDA0001176093150000021.GIF" wi="530" he="190" />计算步骤(3)所得m组中的每个组中每对图像<I<sub>i</sub>,I<sub>j</sub>>IDF加权稀疏编码的相似度Y,若Y大于0.7,则图像<I<sub>i</sub>,I<sub>j</sub>>为相似图像对;其中,j为大于等于1的自然数,且i≠j;g'<sub>i</sub>和g'<sub>j</sub>分别表示图像I<sub>i</sub>和I<sub>j</sub>的IDF加权稀疏编码;(5)将步骤(4)所得结果中具有相同图像的相似图像对合并,生成相似图像子集。 |