发明名称 用于根据数据仓库提供统计信息的方法和系统
摘要 本发明涉及一种用于根据数据仓库(410)提供统计数据的方法,数据仓库包括一种或多种数据存储装置以及耦合至数据存储装置的一个或多个处理器,所述方法的特征在于包括以下步骤:定义多个索引域(114),每一个索引域都接受多个索引域值;建立多个索引文件(432)并且将文件分层级地索引为索引树(300),其中对于每一棵树都包括以下步骤:分层级地排序索引域(201);定义分选仓,每一个分选仓都关联至一个索引域并且收集用于该索引域的一个或多个索引域值;通过级联跟分层级排序的索引域的层级相一致的一个或多个分选仓构成分选仓序列而建立索引,索引在每一个索引域中都只包括一个分选仓;将文件分层级地索引为索引树(300),每一个索引都拥有零个或更多个子索引和/或拥有最多一个父索引,以使每一个子索引都包括跟其父索引的索引再加上关联至附加索引域的至少一个附加分选仓相同的分选仓序列;给每一个索引提供被设置用于存储统计数据的数据容器(325,335),以使每一个数据容器都被索引并且可以从分层级索引的文件中直接寻址;接收(436)一个或多个包括原始数据的输入文件(434)并且用输入文件(434)更新数据容器,其中包括对于每一个输入文件都使用一个或多个处理器来设置用于执行以下步骤:从原始数据中识别和提取至少一种属性以通过统计信息和表现所述属性特征的一个或多个输入文件参数进行分析;根据输入文件(434)建立至少一条个体记录(620),每一条个体记录(620)都包括至少一种属性和表现所述属性特征的一个或多个输入文件参数;将每一个输入文件参数与至少一个索引域相关联;在每一个输入文件参数以及关联至该输入文件参数的至少一个索引域的分选仓之间建立对应关系;识别出用全都跟所述个体记录(620)的输入文件参数相对应的一个或多个分选仓索引的数据容器;用所述个体记录(620)的至少一种属性增量式地更新识别出的数据容器(325,335)以获取描述属性的统计数据。
申请公布号 CN103548019A 申请公布日期 2014.01.29
申请号 CN201280009577.8 申请日期 2012.02.20
申请人 阿玛得斯两合公司 发明人 G·纳斯
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 金晓
主权项 一种用于根据数据仓库(410)提供统计数据的方法,其特征在于包括由至少一个数据处理器执行的以下步骤:·定义多个索引域(114),每一个索引域都接受多个索引域值;·建立多个文件(432)并且将所述文件分层级地索引为索引树(300),其中对于每一棵树都包括以下步骤:‑分层级地排序索引域(201);‑定义分选仓,每一个分选仓都关联至一个索引域并且收集用于该索引域的一个或多个索引域值;‑通过级联跟分层级排序的索引域的层级一致的一个或多个分选仓以构成分选仓序列从而建立索引,索引对每一个索引域都只包括一个分选仓;‑将文件分层级地索引为索引树(300),每一个索引都拥有零个或更多个子索引和/或拥有最多一个父索引,以使每一个子索引都包括跟其父索引的索引相同的分选仓序列再加上关联至附加索引域的至少一个附加分选仓;·给每一个索引提供被设置用于存储统计数据的数据容器(325,335),以使每一个数据容器都被索引并且能够从分层级索引的文件中直接寻址;·接收(436)一个或多个包括原始数据的输入文件(434)并且用输入文件(434)更新所述数据容器,其中包括对于每一个输入文件都使用一个或多个处理器,其被设置用于执行以下步骤:‑从原始数据中识别和提取通过统计信息分析的至少一种属性和表征所述属性的一个或多个输入文件参数;‑根据输入文件(434)建立至少一条个体记录(620),每一条个体记录(620)都包括至少一种属性和表征所述属性的一个或多个输入文件参数;‑将每一个输入文件参数与至少一个索引域相关联;‑在每一个输入文件参数以及关联至该输入文件参数的至少一个索引域的分选仓之间建立对应关系;‑识别出用全都跟所述个体记录(620)的输入文件参数相对应的一个或多个分选仓来索引的数据容器;‑用所述个体记录(620)的至少一种属性增量式地更新识别出的数据容器(325,335)以获取描述所述属性的统计数据。
地址 法国比奥