发明名称 在计算机上执行的用于处理多维数据的方法
摘要 一项能生成简洁索引的改进的多维数据索引技术,使得大多数甚至全部索引在任何时候都可以驻留在主存储器中。在划分聚类和降维时,就生成聚类信息和降维信息,以便在后面的检索阶段使用。即使有不是高度相关的变量存在,该索引技术仍然是有效的。其他一些特征可提供使用该聚类信息和降维信息,非常有效地进行精确检索和最近邻检索。一个关于降维的例子中使用了单值分解技术,本方法也可以递归地应用于每一个降维的聚类。该降维也可以用于整个数据库,作为索引生成的第一步。
申请公布号 CN100429650C 申请公布日期 2008.10.29
申请号 CN98123803.3 申请日期 1998.10.30
申请人 国际商业机器公司 发明人 维托里奥·卡斯特里;李春生;亚利山大·托马西安
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 杨国旭
主权项 1.一种在计算机上执行的用于处理多维数据的方法,包括下列诸步骤:a)将该多维数据划分为一个或多个聚类;b)为所述一个或多个聚类生成以及存储聚类信息;c)为所述一个或多个聚类生成一个或多个降维聚类以及降维信息;以及d)存储该降维信息;递归地执行步骤a)-d),生成一个多层次的降维聚类;为该多层次聚类中处于最低层次的聚类生成并存储一个或多个低维索引。
地址 美国纽约