发明名称 用于处理非结构化数字的基于内容的检索引擎
摘要 公开了用于接收和索引原生数字数据、产生用于后续存储的签名矢量,以及在数字数据的数据库中检索此类原生数字数据的系统及方法。可将原生数字数据转换成相关的转换数据集。此类转换可包括类熵转换和/或空间频率转换。随后可将所述原生和相关的转换数据集划分成谱分量,并且那些谱分量可具有应用于其以产生签名矢量的统计矩。还公开了用于处理非图像数字数据的其他系统和方法。可将非图像数字数据转换成振幅对照时间的数据集,并且随后可将谱图应用于此类数据集。随后可如所描述地处理此类转换数据集。
申请公布号 CN105144200A 申请公布日期 2015.12.09
申请号 CN201480021662.5 申请日期 2014.04.27
申请人 数据飞讯公司 发明人 哈罗德·特雷斯;琳恩·特雷斯;肖恩·赫雷拉
分类号 G06K9/34(2006.01)I 主分类号 G06K9/34(2006.01)I
代理机构 上海脱颖律师事务所 31259 代理人 脱颖
主权项 一种用于检索数字数据的系统,包括:索引模块,所述索引模块能够接收原生数字数据集,所述原生数字数据集包括谱分布;签名生成模块,所述签名生成模块能够根据所述原生数字数据集产生一个或多个转换数据集,以及根据所述原生数字数据集和所述一个或多个转换数据集产生签名矢量,所述签名矢量包括针对所述原生数字数据集和所述一个或多个转换数据集中的每一者的谱分解和统计分解;TOC数据库,所述TOC数据库能够存储所述签名矢量;以及检索模块,所述检索模块能够接收输入签名矢量并且返回大体上接近于所述输入签名矢量的一组签名矢量,其中所述输入签名矢量表示将利用所述TOC数据库检索的所关注对象。
地址 美国加利福尼亚州