发明名称 基于随机化视觉词典组和上下文语义信息的目标检索方法
摘要 本发明涉及一种基于随机化视觉词典组和上下文语义信息的目标检索方法。首先采用精确欧氏位置敏感哈希函数对训练图像库的局部特征点进行聚类,生成一组支持动态扩充的随机化视觉词典组;然后选取查询图像并用矩形框界定目标区域,提取查询图像和图像数据库的SIFT特征并对其进行E<sup>2</sup>LSH映射,实现特征点与视觉单词的匹配;在语言模型的基础上利用查询目标区域及其周围视觉单元的图像显著度,计算查询图像中各视觉单词的检索得分,构造包含目标上下文语义信息的目标模型;最后将图像库的特征向量存为索引文件,并引入K-L散度对目标的语言模型与图像库中任一图像的语言模型进行相似性度量,得到检索结果。
申请公布号 CN102693311B 申请公布日期 2014.07.23
申请号 CN201210168671.X 申请日期 2012.05.28
申请人 中国人民解放军信息工程大学 发明人 赵永威;李弼程;高毫林;蔺博宇
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 郑州大通专利商标代理有限公司 41111 代理人 陈大通
主权项 一种基于随机化视觉词典组和上下文语义信息的目标检索方法,其特征是:首先,采用精确欧氏位置敏感哈希函数对训练图像库的局部特征点进行聚类,生成一组支持动态扩充的随机化视觉词典组;其次,选取查询图像并用矩形框界定目标区域,然后根据Lowe的方法提取查询图像和图像数据库的SIFT特征并对其进行E<sup>2</sup>LSH映射,实现特征点与视觉单词的匹配;然后,在视觉语言模型的基础上,利用查询目标区域及其周围视觉单元的图像显著度,计算查询图像中各视觉单词的检索得分,构造包含目标上下文语义信息的目标模型;最后,将图像库的特征向量存为索引文件,并引入K‑L散度对目标的语言模型与图像库中任一图像的语言模型进行相似性度量,得到检索结果。
地址 450002 河南省郑州市俭学街7号
您可能感兴趣的专利