发明名称 | 基于变体标记网络的数据分群 | ||
摘要 | 接收数据记录,每个都包括一个或多个字段中的一个或多个值,对所接收的数据记录进行处理以识别一个或多个数据群,该处理包括:识别(110)多个标记,所述标记中每个都包括一字段或字段组合中的至少一个值或值的片段;生成(120)表示所识别的标记的网络,所述网络的节点表示标记而所述网络的每个边表示标记之间的变体关系;以及用至少部分基于与节点关联的值区分的不同节点子组来生成所述网络的图形表示,其中与特定节点关联的值对该特定节点所表示的标记在所接收的数据记录内出现的实例数目计数加以量化。 | ||
申请公布号 | CN104040544A | 申请公布日期 | 2014.09.10 |
申请号 | CN201280067094.3 | 申请日期 | 2012.11.15 |
申请人 | 起元科技有限公司 | 发明人 | 阿伦·安德森 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 隆天国际知识产权代理有限公司 72003 | 代理人 | 张浴月;李玉锁 |
主权项 | 一种方法,包括:接收数据记录,所接收的数据记录中每个都包括一个或多个字段中的一个或多个值;以及处理所接收的数据记录以识别一个或多个数据群,该处理包括:识别多个标记,所述标记中每个都包括一字段或字段组合中的至少一个值或值的片段;生成表示所识别的标记的网络,所述网络的节点表示标记而所述网络的每个边表示标记之间的变体关系;以及至少部分基于与节点关联的值来生成不同节点子组被加以区分的所述网络的图形表示,其中与特定节点关联的值对该特定节点所表示的标记在所接收的数据记录内出现的实例数目计数加以量化。 | ||
地址 | 美国马萨诸塞州 |