发明名称 一种图像检索中视觉单词的提取方法
摘要 本发明公开了一种图像检索中视觉单词的提取方法,属于多媒体信息检索、模式识别等智能信息处理领域。本发明通过对图像库中的局部特征集合进行二值化,得到特征独特性和信息量保持的二值局部特征,在向量空间上提高特征的空间利用率,有利于提高视觉单词的独特性,并通过快速计算二值特征的汉明距离在之后的检索或分类应用中提高计算的速度和减小存储的代价。
申请公布号 CN103235955A 申请公布日期 2013.08.07
申请号 CN201310159183.7 申请日期 2013.05.03
申请人 中国传媒大学;新华通讯社 发明人 黄祥林;吕慧;陈明祥;杨丽芳;范瑛;张璐;邢承磊
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 代理人
主权项 1.一种图像检索中视觉单词的提取方法,其特征在于,包括以下步骤:1.1提取图像库中所有图像的局部特征,得到特征样本训练集F={f<sub>1</sub>,f<sub>2</sub>,...,f<sub>m</sub>},m表示图形的数目,f<sub>i</sub>表示图像i的局部特征向量集合,f<sub>i</sub>可以表示为f<sub>i</sub>={t<sub>i1</sub>,t<sub>i2</sub>,...,t<sub>im</sub>},m表示图像的局部特征向量数目,t<sub>im</sub>表示图像i的第m个特征;1.2对特征样本训练集中局部特征向量在每个维度上进行统计,得到每个维度上的中值B={b<sub>1</sub>,b<sub>2</sub>,...b<sub>n</sub>},n代表局部特征的维度,b<sub>i</sub>表示维度i上的中值;1.3对特征样本训练集进行聚类训练,得到聚类中心作为“视觉词表”V={v<sub>1</sub>,v<sub>2</sub>,...,v<sub>k</sub>},k表示聚类的数目,即视觉词表的大小。v<sub>i</sub>表示视觉单词i对应的局部特征向量表示;1.4利用1.2中得到的维度中值作为阈值,将视觉词表V中的向量进行二值化,得到二值化的视觉词表<img file="FSA00000887543000011.GIF" wi="397" he="62" />1.5对单幅图像,提取其局部特征向量集合f,并利用1.2中的维度中值作为阈值,对每个特征向量进行二值化,得到二值化的特征向量集合f<sup>b</sup>;1.6取出单幅图像的二值化特征向量集合f<sup>b</sup>中的每个二值化特征向量,与1.4中的二值化视觉词表中的二值化向量进行比较,将距离最近或最相似的二值化向量对应的视觉单词作为该二值化特征对应的视觉单词。
地址 100024 北京市朝阳区定福庄东街1号