发明名称 不确定时间序列中不确定频繁模式的确定方法
摘要 本发明提出了一种不确定时间序列中不确定频繁模式的确定方法,属于时间序列处理领域。该方法包括以下步骤:S1、选择不确定频繁模式的类型并设定次数阈值<img file="DDA00002076909400011.GIF" wi="37" he="48" />和概率阈值η,其中不确定频繁模式的类型包括最小出现模式和非重叠出现模式;S2、根据不确定频繁模式的类型,计算各候选模式在不确定时间序列中的有效实例,并确定各候选模式的类型为第一种候选模式还是第二种候选模式;S3、采用动态规划技术判断第一种候选模式是否为不确定频繁模式;S4、结合状态空间压缩编码技术和模糊规划技术判断第二种候选模式是否为不确定频繁模式。本发明可以精确确定不确定时间序列中不确定频繁模式,此外,采用状态空间压缩编码技术提高了计算效率。
申请公布号 CN102867118B 申请公布日期 2016.03.23
申请号 CN201210314070.5 申请日期 2012.08.30
申请人 重庆汉光电子工程有限责任公司 发明人 万里
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 重庆市前沿专利事务所(普通合伙) 50211 代理人 郭云
主权项 一种不确定时间序列中不确定频繁模式的确定方法,其特征在于包括以下步骤:S1、选择不确定时间序列中不确定频繁模式的类型并设定不确定频繁模式的次数阈值<img file="FDA0000810632850000011.GIF" wi="45" he="57" />和概率阈值η,其中不确定频繁模式的类型包括最小出现模式和非重叠出现模式,且<img file="FDA0000810632850000012.GIF" wi="46" he="61" />为正整数,η为[0,1]之间的小数;S2、根据不确定频繁模式的类型,计算各候选模式在不确定时间序列中的有效实例:若不确定频繁模式的类型为最小出现模式,则该候选模式对应的有效实例是指该候选模式在不确定时间序列的所有实例中不包括其他实例的实例,若不确定频繁模式的类型为非重叠出现模式,则该候选模式对应的有效实例是指该候选模式在不确定时间序列的所有实例中不相互重叠的实例;确定各候选模式的类型:如果候选模式对应的任意两个有效实例可以相互独立出现在不确定时间序列中则确定该候选模式为第一种候选模式;否则确定该候选模式为第二种候选模式;S3、针对第一种候选模式,采用动态规划技术计算第一种候选模式出现次数X大于次数阈值<img file="FDA0000810632850000013.GIF" wi="45" he="55" />的概率<img file="FDA0000810632850000014.GIF" wi="582" he="78" />并且在<img file="FDA0000810632850000015.GIF" wi="324" he="79" />时判定该第一种候选模式为不确定频繁模式;S4、针对第二种候选模式,采用状态空间压缩编码技术计算第二种候选模式出现次数X大于次数阈值<img file="FDA0000810632850000016.GIF" wi="46" he="59" />的概率<img file="FDA0000810632850000017.GIF" wi="572" he="78" />并且在<img file="FDA0000810632850000018.GIF" wi="236" he="77" /><img file="FDA0000810632850000019.GIF" wi="76" he="63" />时判定该第二种候选模式为不确定频繁模式;所述步骤S4中采用状态空间压缩编码技术计算第二种候选模式出现次数X大于次数阈值<img file="FDA00008106328500000110.GIF" wi="46" he="56" />的概率<img file="FDA00008106328500000111.GIF" wi="239" he="79" />的过程由以下步骤组成:A‑1、将不确定时间序列的实例分别由状态编码向量v表示,其中该状态编码向量中包含用于表示对应不确定时间序列的实例中第二种候选模式出现的个数的元素;A‑2、基于嵌入式马氏链模型,分别计算出不确定时间序列中每一实例出现之后,当前不确定时间序列的实例中分别包括<img file="FDA0000810632850000021.GIF" wi="133" he="70" />个第二种候选模式的实例出现的概率,从而列出该状态编码向量对应的概率矩阵;A‑3、从时间点t<sub>i</sub>开始,根据公式<img file="FDA0000810632850000022.GIF" wi="846" he="191" />计算出第二种候选模式出现次数X大于不确定频繁模式的次数阈值<img file="FDA0000810632850000023.GIF" wi="46" he="53" />的概率<img file="FDA0000810632850000024.GIF" wi="341" he="95" />其中<img file="FDA00008106328500000210.GIF" wi="334" he="108" />表示不确定时间序列中以t<sub>i</sub>为开始时间点的实例出现之后,当前不确定时间序列的实例中包含有u个第二种候选模式的实例出现的概率;A‑4、将该概率<img file="FDA0000810632850000025.GIF" wi="285" he="94" />与不确定频繁模式的概率阈值η进行比较:在<img file="FDA0000810632850000026.GIF" wi="452" he="103" />时判定该第二候选模式为不确定频繁模式。
地址 400039 重庆市九龙坡区科园一路73号(渝高商务大厦)24层