发明名称 一种基于故障预测的云计算系统自适应监测方法
摘要 发明涉及一种基于故障预测的云计算系统自适应监测方法。采用主成分分析技术计算监测数据的特征向量以刻画系统运行状态,通过计算当前与历史监测数据的特征向量的偏差来评估系统异常程度。当被监测系统异常程度较高时,缩短监测周期以密切跟踪被监测系统运行状态,从而提高错误预测与检测的准确性和及时性。反之,当被监测系统异常程度较低时,延长监测周期,从而降低监测开销。
申请公布号 CN105677538A 申请公布日期 2016.06.15
申请号 CN201610015230.4 申请日期 2016.01.11
申请人 中国科学院软件研究所 发明人 王焘;张文博;魏峻;钟华
分类号 G06F11/30(2006.01)I 主分类号 G06F11/30(2006.01)I
代理机构 北京科迪生专利代理有限责任公司 11251 代理人 成金玉;孟卜娟
主权项 一种基于故障预测的云计算系统自适应监测方法,其特征在于实现步骤如下:第一步,监测数据收集;建立滑动窗口的长度为n,收集多度量监测数据为X=(x<sub>1</sub>,x<sub>2</sub>,…,x<sub>m</sub>),其中,每次收集的监测数据包括m个度量,x<sub>i</sub>为第i个度量的值,将监测数据按时间先后顺序存入滑动窗口,将滑动窗口中的监测数据组成n行m列矩阵A<sub>nm</sub>;第二步,异常程度评估,具体包括以下步骤:(1)将A<sub>nm</sub>的每一列的数值进行标准化处理,使第j列的数值的集合的均值μ<sub>j</sub>=0,方差σ<sub>j</sub>=1,第i行第j列的数据标准化为z<sub>ij</sub>=(x<sub>ij</sub>‑μ<sub>j</sub>)/σ<sub>j</sub>。求出协方差矩阵:<img file="FDA0000904103840000011.GIF" wi="429" he="222" />其中,<maths num="0001"><math><![CDATA[<mrow><msubsup><mi>&sigma;</mi><mrow><mi>i</mi><mi>j</mi></mrow><mn>2</mn></msubsup><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msub><mi>z</mi><mrow><mi>k</mi><mi>i</mi></mrow></msub><msub><mi>z</mi><mrow><mi>k</mi><mi>j</mi></mrow></msub><mo>/</mo><mi>n</mi><mo>;</mo></mrow>]]></math><img file="FDA0000904103840000012.GIF" wi="390" he="142" /></maths>计算协方差矩阵∑<sub>A</sub>的特征向量u;(2)新的监测数据x<sub>t</sub>到来时,为了放大离群点对主方向改变的影响,将样本复制nr次,其中r∈[0,1]是当前样本的复制次数与当前样本大小的比例,得到更新矩阵:<maths num="0002"><math><![CDATA[<mrow><mover><mi>A</mi><mo>~</mo></mover><mo>=</mo><mi>A</mi><mo>&cup;</mo><mo>{</mo><msub><mi>x</mi><mi>t</mi></msub><mo>,</mo><msub><mi>x</mi><mi>t</mi></msub><mo>,</mo><mo>...</mo><mo>,</mo><msub><mi>x</mi><mi>t</mi></msub><mo>}</mo><mo>;</mo></mrow>]]></math><img file="FDA0000904103840000013.GIF" wi="446" he="78" /></maths>更新矩阵均值和协方差矩阵:<maths num="0003"><math><![CDATA[<mrow><mover><mi>&mu;</mi><mo>~</mo></mover><mo>=</mo><mfrac><mrow><mi>&mu;</mi><mo>+</mo><msub><mi>rx</mi><mi>t</mi></msub></mrow><mrow><mn>1</mn><mo>+</mo><mi>r</mi></mrow></mfrac><mo>,</mo><msub><mi>&Sigma;</mi><mover><mi>A</mi><mo>~</mo></mover></msub><mo>=</mo><mfrac><mi>Q</mi><mrow><mn>1</mn><mo>+</mo><mi>r</mi></mrow></mfrac><mo>+</mo><mfrac><mi>r</mi><mrow><mn>1</mn><mo>+</mo><mi>r</mi></mrow></mfrac><msub><mi>x</mi><mi>t</mi></msub><msubsup><mi>x</mi><mi>t</mi><mi>T</mi></msubsup><mo>-</mo><mover><mi>&mu;</mi><mo>~</mo></mover><msup><mover><mi>&mu;</mi><mo>~</mo></mover><mi>T</mi></msup><mo>,</mo></mrow>]]></math><img file="FDA0000904103840000014.GIF" wi="901" he="127" /></maths><img file="FDA0000904103840000015.GIF" wi="222" he="134" />计算当前监测数据的特征向量:<img file="FDA0000904103840000016.GIF" wi="277" he="157" />(3)使用余弦相似度来计算由步骤(2)得到的原特征向量与由步骤(3)得到的当前特征向量的偏差,以描述当前收集到的监测数据的异常程度:<img file="FDA0000904103840000017.GIF" wi="359" he="166" />第三步,监测周期调整。根据由第二步得到的异常程度,调整监测周期为:<maths num="0004"><math><![CDATA[<mrow><mi>T</mi><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>T</mi><mi>&beta;</mi></msub><mo>,</mo></mrow></mtd><mtd><mrow><mn>0</mn><mo>&le;</mo><msub><mi>s</mi><mi>t</mi></msub><mo>&le;</mo><mi>&beta;</mi></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>T</mi><mi>&alpha;</mi></msub><mo>+</mo><mi>l</mi><mi>n</mi><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>s</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>/</mo><mi>&lambda;</mi><mo>,</mo></mrow></mtd><mtd><mrow><mi>&beta;</mi><mo>&lt;</mo><msub><mi>s</mi><mi>t</mi></msub><mo>&lt;</mo><mi>&alpha;</mi></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>T</mi><mi>&alpha;</mi></msub><mo>,</mo></mrow></mtd><mtd><mrow><mi>&alpha;</mi><mo>&le;</mo><msub><mi>s</mi><mi>t</mi></msub><mo>&le;</mo><mn>1</mn></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000904103840000018.GIF" wi="745" he="228" /></maths>其中,T<sub>α</sub>、T<sub>β</sub>为运维人员根据经验设定的被监测系统的最大、最小监测周期,α、β为运维人员根据经验设定的被监测系统的最小、最大错误概率,λ为运维人员根据经验设定的被监测系统的出现故障的频率。
地址 100190 北京市海淀区中关村南四街4号