发明名称 近重复图片的计算机查找方法和装置
摘要
申请公布号 TWI499921 申请公布日期 2015.09.11
申请号 TW099106633 申请日期 2010.03.08
申请人 阿里巴巴集团控股有限公司 发明人 贾梦雷
分类号 G06F17/30 主分类号 G06F17/30
代理机构 代理人 林志刚 台北市中山区南京东路2段125号7楼
主权项 一种近重复图片的电脑查找方法,其特征在于,该方法包括:读取资料库中储存的多张待分组图片;将读取的所述多张待分组图片划分为多个分组,其中:划分为多个分组后同一分组中图片的主颜色相同;且所述多张待分组图片划分为多个分组包括:选定图片的颜色空间;将所述颜色空间量化到多种颜色;计算对应至该图片的每一颜色的像素的数量:以及将对应至数量最多的像素的颜色识别为该主颜色;将每一个分组图片储存在不同的分组资料库中;读取给定图片;查找所储存图片的主颜色与给定图片的主颜色相同的分组资料库,并读取查找到的分组资料库中的图片;将从分组资料库中读取的图片的图像特征与所述给定图片的图像特征进行匹配,并识别匹配结果满足预先设定的近重复图片判定条件的图片为所述给定图片的近重复图片;以及决定所述给定图片之一及该分组的一个以上的该图片 之主颜色率,其中决定该主颜色率包括:计算对应至该图片的多种颜色的像素的数量;在图片中寻找相较于该图片中的其他颜色的像素数量具有较高数量之像素的颜色:以及计算具有较高数量的该图片中的该颜色之像素的比率以及该图片中像素的总种数量;以及其中该近重复图片判定条件包含:该给定图片之颜色特征向量与分组的图片之颜色特征向量间的距离小于第一预设阈值,该给定图片的该主颜色率及该分组中之图片的主颜色率间的距离小于第二预设阈值,以及该给定图片的该主颜色率以及在分组中图片的主色率间的差异小于第三预设阈值;其中该第二预设阈值的值大于该第三预设阈值的值。
地址 香港