发明名称 一种基于稀疏表示的近似图像重复检测方法
摘要 本发明公开了一种基于稀疏表示的近似重复图像检测方法,该方法基于hadoop分布式计算框架提出,该检测方法包括如下步骤,先获取图像集I,其中中所有图像的稀疏编码为g′;提取g′中非零元素,将图像I<sub>i</sub>的稀疏编码g<sub>i</sub>′散列到非零元素的下标对应的组中,计算每个Reduce函数中每对图像&lt;I<sub>w</sub>,I<sub>z</sub>&gt;稀疏编码的相似度Y,若Y大于0.7,则输出相似图像对&lt;I<sub>w</sub>,I<sub>z</sub>&gt;;将具有图像I<sub>w</sub>的相似图像对合并,生成相似图像子集。本发明通过并行化的计算方式大大提高了针对大规模数据集KMeans聚类算法的计算效率,并引入稀疏表示理论,具有更快的实现方法不需要过多的求解优化过程。
申请公布号 CN106599917A 申请公布日期 2017.04.26
申请号 CN201611130891.8 申请日期 2016.12.09
申请人 西北大学 发明人 赵万青;罗迒哉;范建平;彭进业
分类号 G06K9/62(2006.01)I;G06K9/46(2006.01)N 主分类号 G06K9/62(2006.01)I
代理机构 西安恒泰知识产权代理事务所 61216 代理人 王芳
主权项 一种基于稀疏表示的近似重复图像检测方法,该方法基于hadoop分布式计算框架提出,该检测方法包括如下步骤,获取图像集I中所有图像的IDF加权稀疏编码g′,其中I=(I<sub>1</sub>,I<sub>2</sub>,...,I<sub>i</sub>,...,I<sub>w</sub>,…,I<sub>z</sub>,…,I<sub>R</sub>),I<sub>i</sub>的IDF加权稀疏编码为g<sub>i</sub>′,g<sub>i</sub>′∈g′,i为大于等于1的自然数,w为大于i的自然数,z为大于w的自然数,R为大于z的自然数,其特征在于,方法还包括:(1)提取图像I<sub>i</sub>的IDF加权稀疏编码g<sub>i</sub>′中的非零元素;g<sub>ik</sub>′∈g<sub>i</sub>′,k为大于等于1的自然数,g<sub>i</sub>′内的非零元素为(g<sub>iu</sub>′,...,g<sub>iv</sub>′),设非零元素为m个,m为大于等于1的自然数,m≤k,g<sub>iu</sub>′≠0,g<sub>iv</sub>′≠0,u为大于等于1的自然数,v大于等于1的自然数,k&gt;v&gt;u;(2)建立k个组,分别命名为:<img file="FDA0001176093150000011.GIF" wi="259" he="615" />其中,<img file="FDA0001176093150000012.GIF" wi="161" he="527" />为空矩阵;(3)利用(式1)的矩阵变换,将图像I<sub>i</sub>的IDF加权稀疏编码g<sub>i</sub>′分别散列到非零元素的下标(u,...,v)对应的m个组里;<img file="FDA0001176093150000013.GIF" wi="1454" he="622" />(4)利用<img file="FDA0001176093150000021.GIF" wi="530" he="190" />计算步骤(3)所得m组中的每个组中每对图像&lt;I<sub>i</sub>,I<sub>j</sub>&gt;IDF加权稀疏编码的相似度Y,若Y大于0.7,则图像&lt;I<sub>i</sub>,I<sub>j</sub>&gt;为相似图像对;其中,j为大于等于1的自然数,且i≠j;g'<sub>i</sub>和g'<sub>j</sub>分别表示图像I<sub>i</sub>和I<sub>j</sub>的IDF加权稀疏编码;(5)将步骤(4)所得结果中具有相同图像的相似图像对合并,生成相似图像子集。
地址 710069 陕西省西安市太白北路229号