发明名称 |
用于通过在柱状数据结构中提供数据记录而确定规则的方法 |
摘要 |
本发明提供一种用于确定第一规则(401-407)的计算机实现的方法,其中每个第一规则包括源属性值对和目的属性值对。列式数据库包括多个(214;609)列式数据结构(109,110;225,226,227),每个列式数据结构与一个列属性(215-224)相关联并且包括一个或者多个列条目(235)。第一数据记录(213,230-234)被存储在所述列式数据库中。存在掩码数据结构(320-323),以及每个掩码数据结构具有与所述列式数据结构中的一个列式数据结构相同的结构。所述掩码数据结构包括一个或者多个第二属性值对。通过求交所述列式数据结构和所述掩码数据结构,选择第二数据记录作为所述第一数据记录的子集。选择列属性中的一个以及包含在与所述列属性相关联的所述列式数据结构中的一个值,作为所述目的属性值对。创建针对所述第二数据记录的每个第一属性值对的一个第二规则。针对每个第二规则而计算同现计数。选择一个或者多个所述第二规则作为所述第一规则。 |
申请公布号 |
CN103548024A |
申请公布日期 |
2014.01.29 |
申请号 |
CN201280024809.7 |
申请日期 |
2012.05.25 |
申请人 |
国际商业机器公司 |
发明人 |
M·伍斯特;E·黑希勒;M·奥博霍费尔;P·丹特雷桑格尔 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市金杜律师事务所 11256 |
代理人 |
酆迅;李峥宇 |
主权项 |
一种用于确定第一规则(401‑407)的计算机实现的方法,其中每个第一规则包括源属性值对和目的属性值对,所述方法包括步骤:‑提供列式数据库,所述列式数据库包括多个(214;609)列式数据结构(109,110;225,226,227),每个列式数据结构与一个列属性(215‑224)相关联并且包括一个或者多个列条目(235);‑提供第一数据记录(213,230‑234),所述第一数据记录被存储在所述列式数据库中,每个第一数据记录具有多个第一属性值对,其中所述第一属性值对的每个值被存储在与相应列属性(215‑224)相关联的所述列式数据结构(225‑227)中的一个列式数据结构中,其中每个列条目与所述相应列属性的一个值相关联并且包括计数信息,所述计数信息指示具有所述相应第一属性值对的第一数据记录的数量;‑提供掩码数据结构(320‑323),每个掩码数据结构具有与所述列式数据结构中的一个列式数据结构相同的结构,所述掩码数据结构包括一个或者多个第二属性值对;‑通过求交所述列式数据结构和所述掩码数据结构,选择第二数据记录作为所述第一数据记录的子集,所述第二数据记录选择性地包括第一数据记录,所述第一数据记录包括与所述一个或者多个第二属性值对中的一个第二属性值对相匹配的至少一个第一属性值对;‑选择所述列属性中的一个列属性以及包含在与所选择的所述列属性相关联的所述列数据结构中的一个值作为所述目的属性值对;‑创建用于所述第二数据记录的每个第一属性值对的一个第二规则,其中所述第一属性值对被用作所述第二规则的源属性值对,以及其中所选择的所述目的属性值对被用作所述第二规则的目的属 性值对;‑针对每个第二规则计算在其相应源属性值对和其目的属性值对之间的同现计数;以及‑依赖于计算的所述同现计数,特别地选择一个或者多个所述第二规则作为所述第一规则。 |
地址 |
美国纽约阿芒克 |