发明名称 一种自动判别服务器故障的方法
摘要 本申请公开了一种自动判别服务器故障的方法,其中方法包括:将集群服务器中的多种运行信息实时传输汇总到计算服务器;所述计算服务器从运行信息集合R<sup>N</sup>选取K个初始聚类中心;根据所述初始聚类中心,计算每个数据对象与聚类中心对象的距离;根据每个点距K个聚类中心的最小距离重新对每个点所属聚类簇进行划分;重新计算有变化的聚类簇的中心;计算标准测度函数;若所述标准测度函数满足预设条件,则算法终止。本发明通过基于大数据的数据将服务器指标进行分析,从中发现故障类别,从而实现对海量集群的服务器故障的自动预测判定。
申请公布号 CN105306252A 申请公布日期 2016.02.03
申请号 CN201510601742.4 申请日期 2015.09.19
申请人 北京暴风科技股份有限公司 发明人 廖旻可;王佳;毕先春;卢述奇
分类号 H04L12/24(2006.01)I 主分类号 H04L12/24(2006.01)I
代理机构 代理人
主权项 一种自动判别服务器故障的方法,其特征在于,包括:将集群服务器中的多种运行信息实时传输汇总到计算服务器;所述计算服务器从运行信息集合R<sup>N</sup>选取K个初始聚类中心;根据所述初始聚类中心,计算每个数据对象与聚类中心对象的距离;根据每个点距K个聚类中心的最小距离重新对每个点所属聚类簇进行划分;重新计算有变化的聚类簇的中心;计算标准测度函数;若所述标准测度函数满足预设条件,则算法终止;其中,所述K个初始聚类中心选取过程如下所示:对所述运行信息集合R<sup>N</sup>进行采样得到样本数为M的样本数据集S<sup>M</sup>;选取所述样本数据集S<sup>M</sup>所有数据记录的质心作为第一个聚类中心,所述质心的计算公式如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>c</mi><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munder><mo>&Sigma;</mo><mrow><mi>x</mi><mo>&Element;</mo><msup><mi>S</mi><mi>M</mi></msup></mrow></munder><mi>x</mi></mrow>]]></math><img file="FDA0000806666560000011.GIF" wi="253" he="134" /></maths>对于每个后继K‑1个聚类中心,选择距已经选取过的初始聚类中心最远的点,所述质心与数据记录间距离计算公式如下:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>d</mi><mi>i</mi><mi>s</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>c</mi><mi>i</mi></msub><mo>,</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msubsup><mi>&mu;</mi><mn>1</mn><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>&mu;</mi><mn>1</mn></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>&mu;</mi><mn>2</mn><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>&mu;</mi><mn>2</mn></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>&mu;</mi><mi>j</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>&mu;</mi><mi>j</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><mn>...</mn><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>&mu;</mi><mi>n</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>&mu;</mi><mi>n</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow>]]></math><img file="FDA0000806666560000012.GIF" wi="1406" he="95" /></maths>其中,n种运行信息,记为μ<sub>1</sub>,μ<sub>2</sub>,...,μ<sub>n</sub>;R<sup>N</sup>为全部运行信息集合,N为数据记录总数;x为每条数据记录,每条数据记录包含此前搜集的n种运行信息,将每条数据记录看做欧几里得空间中一个点<img file="FDA0000806666560000013.GIF" wi="335" he="101" />K为聚类分析计算中所期望的簇的个数;所述数据对象为所述运行信息集合R<sup>N</sup>中的一条数据记录;所述聚类中心对象为所述聚类中心;C<sub>i</sub>表示第i个簇,也即第i个簇中所有点的集合;c<sub>i</sub>表示簇C<sub>i</sub>的质心。
地址 100191 北京市海淀区学院路51号首享科技大厦6层