发明名称 |
一种资讯图片智能去重的技术方法 |
摘要 |
本发明公开了一种图片去重,特别是近似图片去重的解决方法,对图片做SHA1码处理,把图片对应的SHA1码通过HASH散列按照有效期存起来,对于相同的图片SHA1码是一样的,这种方法可以低成本的比较出两张图片是否相同,但对于修改过的图片,则需要对图片进行缩放,提取出特性,然后使用汉明距离进行判断两张图片的相似的值,如此便可以解决相似或相同图片重复出现的情况,提升用户阅读体验。 |
申请公布号 |
CN104200499A |
申请公布日期 |
2014.12.10 |
申请号 |
CN201410490922.5 |
申请日期 |
2014.09.24 |
申请人 |
深圳市英威诺科技有限公司 |
发明人 |
不公告发明人 |
分类号 |
G06T9/00(2006.01)I |
主分类号 |
G06T9/00(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种图片近似去重的方法,其特征在于,所述方法包括:对同一张图片,进行打码,打水印,剪裁,像素变少或变多,都可以跟原图或者同一张不同编辑的图片进行识别,判断出为同一张图片,要对判断的图片进行SHA1码的比较,如果一样,则判断为相同,如果比较不出来,则需要对图片进行缩放提取出图片特征,然后对图片的像素进行平均处理,按照顺序生成一个64位的二进制码,再比较以前存在HASH set中的64位码的汉明距离,如果汉明距离小于某个阀值,则证明已有相似图片发布。 |
地址 |
518000 广东省深圳市高新南四道创维半导体大厦6楼 |