发明名称 一种用于基于内容的海量图片快速检索的索引构建方法
摘要 本发明涉及一种用于基于内容的海量图片快速检索的索引构建方法,属于智能信息处理技术。现有技术中,对海量图片进行基于内容的检索时,系统响应的时间长,检索效率低,且系统的健壮性不够强。本发明针对基于内容的海量图片快速检索的效率与系统健壮性问题,在平衡多路查找树的索引结构基础上,引入聚类调整机制并提出最小完备子树更新策略和非线性特征量化算法。采用本发明所述的方法将大大提高索引结构的性能,降低检索响应时间,增强系统健壮性,对基于内容的海量图片快速检索系统具有重要的应用价值。
申请公布号 CN100371934C 申请公布日期 2008.02.27
申请号 CN200510073464.6 申请日期 2005.05.30
申请人 北大方正集团有限公司;北京北大方正技术研究院有限公司 发明人 杨建武;吴於茜;陈晓鸥;刘灿
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 北京英赛嘉华知识产权代理有限责任公司 代理人 田明;王达佐
主权项 1.一种用于基于内容的海量图片快速检索的索引构建方法,包括以下步骤:1)读取图片文件,并对图片特征进行分析,图片特征分析结果为一组实数;2)对图片特征进行量化:将在步骤1中得到的一组实数形式的图片特征分析结果量化为一组整数;3)检查索引结构树是否在内存中,如果不在内存中则从磁盘文件中读取,如果磁盘中不存在相关索引文件则创建一个新的索引文件;4)根据量化的图片特征信息检测该图片应该插入到索引树的哪个叶子节点中;5)如果该叶子节点未满则将新图片信息加入该叶子节点,并跳转到第10步;6)如果该叶子节点已满则考虑新图片和原叶子节点中包含的所有图片,将节点分裂形成两个叶子节点;7)考察该节点的父节点是否已满,如果未满则跳转到第10步;8)如果该节点的父节点已满,则检查该节点是否经过聚类,如果经过聚类调整则对该节点进行分裂,并返回转到第7步考察其父节点;9)如果该节点没有经过聚类调整,进行聚类调整;10)修改该节点及其祖先节点的覆盖半径;11)考察当前内存中被修改而未存盘的节点数是否达到上限,如果达到上限则将部分被修改而未存盘的节点进行存盘,结束该图片的索引插入过程。
地址 100871北京市海淀区城府路298号方正大厦