发明名称 检测数据序列中的异常子序列的方法和设备
摘要 公开了一种检测数据序列中的异常子序列的方法和设备。该方法包括:构造目标子序列的分层数据结构;基于目标子序列的分层数据结构以及预先构造的第一数量的参考子序列的分层数据结构,确定目标子序列的第二数量的邻居,即,所述第一数量的参考子序列中、与目标子序列的欧几里德距离最小的第二数量的参考子序列;确定所述第二数量的参考子序列中的每个参考子序列的第三数量的邻居,即,所述数据序列中、与所述每个参考子序列的欧几里德距离最小的第三数量的子序列;以及根据目标子序列的第二数量的邻居、以及所述第二数量的参考子序列中以所述目标子序列为其邻居的参考子序列的第三数量的邻居,确定所述目标子序列是否为异常子序列。
申请公布号 CN104809134A 申请公布日期 2015.07.29
申请号 CN201410040085.6 申请日期 2014.01.27
申请人 国际商业机器公司 发明人 刘凯;陈垚亮;陈晓艳;黄胜;王晨
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 于小宁
主权项 一种检测数据序列中的异常子序列的方法,所述数据序列包括要检测的目标子序列和第一数量的参考子序列,所述方法包括:构造目标子序列的分层数据结构,所述分层数据结构的最底层的每个节点存储目标子序列的对应数据,最底层之上的层的每个节点存储基于在本层的下一层的对应节点中存储的数据导出的值;基于所述目标子序列的分层数据结构以及预先构造的所述第一数量的参考子序列的分层数据结构,确定目标子序列的第二数量的邻居,所述目标子序列的第二数量的邻居是所述第一数量的参考子序列中、与目标子序列的欧几里德距离最小的第二数量的参考子序列;确定所述第二数量的参考子序列中的每个参考子序列的第三数量的邻居,其中所述第三数量的邻居是所述数据序列中、与所述每个参考子序列的欧几里德距离最小的第三数量的子序列;以及根据目标子序列的第二数量的邻居、以及所述第二数量的参考子序列中以所述目标子序列为其邻居的参考子序列的第三数量的邻居,确定所述目标子序列是否为异常子序列。
地址 美国纽约阿芒克