发明名称 |
用于搜索和存储数据的系统和方法 |
摘要 |
一种使用定义的相似性的指标在库中搜索与输入数据相似的数据的位置的系统和方法,其搜索时间与库的大小无关并与输入数据的大小成线性关系,空间需求与库的大小的一小部分成比例。进一步分析被定位的相似数据段,以确定其共同(相同)数据部分,而不考虑共同数据部分在库中的顺序和位置。通过执行远程差分运算,使用显著降低的系统带宽来实现远程运算。 |
申请公布号 |
CN101084499A |
申请公布日期 |
2007.12.05 |
申请号 |
CN200580039086.8 |
申请日期 |
2005.09.15 |
申请人 |
迪利根特技术公司 |
发明人 |
迈克尔·希尔施;海姆·比特内;莱尔·阿罗诺维什;罗恩·阿舍;埃坦·巴什马特;什穆埃尔·T·克莱因 |
分类号 |
G06F17/30(2006.01) |
主分类号 |
G06F17/30(2006.01) |
代理机构 |
中原信达知识产权代理有限责任公司 |
代理人 |
张焕生;谢丽娜 |
主权项 |
1.一种在库数据中识别输入数据的方法,其中所述库数据包括库数据块,所述输入数据包括输入数据块,并且其中每个库数据块具有对应的含有一个或多个库数据块区别特征(RDC)的集,对于每个输入数据块,所述方法包括下列步骤:确定含有一个或多个输入数据块区别特征(IDC)的集;将所确定的IDC集与一个或多个RDC集进行比较;以及根据所确定的IDC集与所述一个多个RDC集的比较来识别与所述输入数据块相似的库数据块。 |
地址 |
美国马萨诸塞州 |