发明名称 |
用于编索引、相似度搜索和分类的矢量变换 |
摘要 |
将特征矢量编码成稀疏二进制矢量。例如从存储装置或者特征矢量生成器获取特征矢量。特征矢量表示媒体对象或者其它数据对象。生成一个或者多个排列,生成的排列的维数等同于特征矢量的维数。可以随机或者用公式生成排列。用一个或者多个排列来排列特征矢量,从而创建一个或者多个排列的特征矢量。根据选择的窗口大小截断排列的特征矢量。标识出表示排列的特征矢量的最大值的索引,并且使用一位热码编码来编码,从而产生一个或者多个稀疏二进制矢量。可以将稀疏二进制矢量连接成单个稀疏二进制矢量并且将其存储。可以在媒体对象的相似度搜索、编索引或者分类中使用稀疏二进制矢量。 |
申请公布号 |
CN103283247B |
申请公布日期 |
2014.11.12 |
申请号 |
CN201180061086.3 |
申请日期 |
2011.11.03 |
申请人 |
谷歌公司 |
发明人 |
J·耶格尼克 |
分类号 |
H04N21/234(2006.01)I;G06F17/00(2006.01)I |
主分类号 |
H04N21/234(2006.01)I |
代理机构 |
北京市金杜律师事务所 11256 |
代理人 |
王茂华;陈颖 |
主权项 |
一种对特征矢量进行编码的计算机实施的方法,所述方法包括:获取特征矢量,所述特征矢量表示目标媒体对象;生成排列,所述排列包括序数矢量,其中包括所述序数矢量的所述排列的维数等同于所述特征矢量的维数;用所述生成的排列来排列所述特征矢量;根据选择的窗口大小截断所述排列的特征矢量;标识所述截断的排列的特征矢量的最大值的索引;以及产生稀疏二进制矢量,所述稀疏二进制矢量包括使用一位热码编码来编码的所述标识的索引。 |
地址 |
美国加利福尼亚州 |