发明名称 | 使用源跟踪剖析数据 | ||
摘要 | 剖析数据包括访问多个记录集合以为每个特定集合存储量化信息,包括:对于特定集合中记录的至少一个选定字段,值计数条目的相应清单(300A-300C),每个包括出现在所述选定字段中的值以及其中该值所出现的记录数的计数。处理两个或更多个所述集合的所述量化信息包括:对于来自第一集合和第二集合的每个的至少一个字段,将相应清单的所述值计数条目合并(302)以产生值计数条目组合清单(304),并且将所述值计数条目组合清单的值计数条目聚合(306),以产生特异字段值条目的清单(308),其识别一特异值并且包括对所述两个或更多个集合的每个中该特异值出现的记录数加以量化的信息。 | ||
申请公布号 | CN104737167A | 申请公布日期 | 2015.06.24 |
申请号 | CN201380055099.9 | 申请日期 | 2013.08.02 |
申请人 | 起元科技有限公司 | 发明人 | 阿伦·安德森 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 隆天知识产权代理有限公司 72003 | 代理人 | 章侃铱;张浴月 |
主权项 | 一种用于剖析存储在数据存储系统中的数据的方法,所述方法包括:通过耦合至所述数据存储系统的接口来访问存储在所述数据存储系统中的多个记录集合,来为所述多个记录集合的每个存储量化信息,对于特定集合中所述记录的至少一个选定字段而言,每个所述特定集合的所述量化信息包括值计数条目的相应清单,每个值计数条目包括出现在所述选定字段中的值以及所述值出现在所述选定字段中的记录数的计数;以及处理两个或更多个所述集合的所述量化信息以产生剖析总结信息,所述处理包括:对于来自所述两个或更多个集合的至少第一集合和第二集合的每个的至少一个字段,将相应清单的所述值计数条目合并以产生值计数条目组合清单,以及将所述值计数条目组合清单的值计数条目聚合,以产生特异字段值条目的清单,所述特异字段值条目的至少一些从所述值计数条目的至少一个中识别出特异值并且包括对所述两个或更多个集合的每个中所述特异值出现的记录数加以量化的信息。 | ||
地址 | 美国马萨诸塞州 |