发明名称 |
多媒体信息检索方法和系统 |
摘要 |
本发明公开了一种多媒体信息检索方法及系统,所述方法包括:提取当前多媒体信息的特征数据,根据提取的特征数据得到所述当前多媒体信息的特征比特向量;对当前多媒体信息的特征比特向量进行分割,得到所述当前多媒体信息的k个子向量;针对所述当前多媒体信息的每个子向量,分别确定对应该子向量的候选集合;对于得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量;并计算所述当前多媒体信息的特征比特向量与查找到的特征比特向量之间的汉明距离,将汉明距离符合设定条件的特征比特向量所对应的多媒体信息作为检索结果输出。利用上述方法通过建立分段索引结构对特征比特向量进行索引,能够大大提高多媒体信息检索速度和检索效率。 |
申请公布号 |
CN103345496A |
申请公布日期 |
2013.10.09 |
申请号 |
CN201310264225.3 |
申请日期 |
2013.06.28 |
申请人 |
新浪网技术(中国)有限公司 |
发明人 |
刘洁 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市京大律师事务所 11321 |
代理人 |
张璐;方晓明 |
主权项 |
一种多媒体信息检索方法,其特征在于,包括:提取当前多媒体信息的特征数据,将提取的特征数据转换为特征比特向量后,对其进行均匀分割,得到k个子向量,其中第i个子向量由所述特征比特向量均匀分割后的第i组元素组成;i为1~k的自然数;分别确定对应所述当前多媒体信息的各子向量的候选集合,其中,针对第i个子向量,具体过程包括:在预先确定的第i个索引结构的索引集中查找出与该第i个子向量相同的索引,并将查找出的索引所对应的向量标识集合作为对应该第i个子向量的候选集合;其中,第i个索引结构中,第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识存储于同一向量标识集合中,且该向量标识集合的索引为该第i个子向量;对于得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量;并计算所述当前多媒体信息的特征比特向量与查找到的特征比特向量之间的汉明距离,将汉明距离符合设定条件的特征比特向量所对应的多媒体信息作为检索结果输出。 |
地址 |
100080 北京市海淀区北四环西路58号理想国际大厦20层 |