一种自动判别服务器故障的方法,申请号CN201510601742.4-传众专利搜索

发明名称	一种自动判别服务器故障的方法
摘要	本申请公开了一种自动判别服务器故障的方法，其中方法包括：将集群服务器中的多种运行信息实时传输汇总到计算服务器；所述计算服务器从运行信息集合R<sup>N</sup>选取K个初始聚类中心；根据所述初始聚类中心，计算每个数据对象与聚类中心对象的距离；根据每个点距K个聚类中心的最小距离重新对每个点所属聚类簇进行划分；重新计算有变化的聚类簇的中心；计算标准测度函数；若所述标准测度函数满足预设条件，则算法终止。本发明通过基于大数据的数据将服务器指标进行分析，从中发现故障类别，从而实现对海量集群的服务器故障的自动预测判定。
申请公布号	CN105306252A	申请公布日期	2016.02.03
申请号	CN201510601742.4	申请日期	2015.09.19
申请人	北京暴风科技股份有限公司	发明人	廖旻可;王佳;毕先春;卢述奇
分类号	H04L12/24(2006.01)I	主分类号	H04L12/24(2006.01)I
代理机构		代理人
主权项	一种自动判别服务器故障的方法，其特征在于，包括：将集群服务器中的多种运行信息实时传输汇总到计算服务器；所述计算服务器从运行信息集合R<sup>N</sup>选取K个初始聚类中心；根据所述初始聚类中心，计算每个数据对象与聚类中心对象的距离；根据每个点距K个聚类中心的最小距离重新对每个点所属聚类簇进行划分；重新计算有变化的聚类簇的中心；计算标准测度函数；若所述标准测度函数满足预设条件，则算法终止；其中，所述K个初始聚类中心选取过程如下所示：对所述运行信息集合R<sup>N</sup>进行采样得到样本数为M的样本数据集S<sup>M</sup>；选取所述样本数据集S<sup>M</sup>所有数据记录的质心作为第一个聚类中心，所述质心的计算公式如下：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>c</mi><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munder><mo>Σ</mo><mrow><mi>x</mi><mo>&Element;</mo><msup><mi>S</mi><mi>M</mi></msup></mrow></munder><mi>x</mi></mrow>]]></math><img file="FDA0000806666560000011.GIF" wi="253" he="134" /></maths>对于每个后继K‑1个聚类中心，选择距已经选取过的初始聚类中心最远的点，所述质心与数据记录间距离计算公式如下：<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>d</mi><mi>i</mi><mi>s</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>c</mi><mi>i</mi></msub><mo>,</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msubsup><mi>μ</mi><mn>1</mn><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>μ</mi><mn>1</mn></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>μ</mi><mn>2</mn><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>μ</mi><mn>2</mn></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>μ</mi><mi>j</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>μ</mi><mi>j</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><mn>...</mn><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>μ</mi><mi>n</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>μ</mi><mi>n</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow>]]></math><img file="FDA0000806666560000012.GIF" wi="1406" he="95" /></maths>其中，n种运行信息，记为μ<sub>1</sub>,μ<sub>2</sub>,...,μ<sub>n</sub>；R<sup>N</sup>为全部运行信息集合，N为数据记录总数；x为每条数据记录，每条数据记录包含此前搜集的n种运行信息，将每条数据记录看做欧几里得空间中一个点<img file="FDA0000806666560000013.GIF" wi="335" he="101" />K为聚类分析计算中所期望的簇的个数；所述数据对象为所述运行信息集合R<sup>N</sup>中的一条数据记录；所述聚类中心对象为所述聚类中心；C<sub>i</sub>表示第i个簇，也即第i个簇中所有点的集合；c<sub>i</sub>表示簇C<sub>i</sub>的质心。
地址	100191 北京市海淀区学院路51号首享科技大厦6层