发明名称 实现对web服务器可用性进行检测的监控系统和方法
摘要 实现对web服务器可用性进行检测的监控系统,该系统包括监控项目执行子系统、核心数据库子系统、告警子系统、统计分析子系统和通信子系统,其中监控项目执行子系统由监控项目调度模块、检测任务调度模块和代理模块组成,核心数据库子系统由代理信息库、监控项目库、检测任务结果库等组成,告警子系统由告警处理模块和告警信息库组成,统计分析子系统由统计分析模块、监控报告模块和统计信息库组成;本发明基于该系统,还提出实现对web服务器可用性进行检测的监控方法;由于采用分布式和瘦客户代理相结合的模式,本发明实现了对web服务器的无侵入式实时在线检测,并能够将web服务器的故障和恢复情况及时反馈给服务器管理者。
申请公布号 CN102624570A 申请公布日期 2012.08.01
申请号 CN201210126433.2 申请日期 2012.04.27
申请人 杭州东信北邮信息技术有限公司 发明人 廖建新;张铁鹰;王锋;胡云亭;樊伟钰
分类号 H04L12/24(2006.01)I;H04L12/26(2006.01)I;H04L29/06(2006.01)I 主分类号 H04L12/24(2006.01)I
代理机构 代理人
主权项 实现对web服务器可用性进行检测的监控系统,其特征在于:所述监控系统包括如下子系统:监控项目执行子系统:该子系统包括监控项目调度模块、检测任务调度模块和代理模块,该子系统的功能是负责监控项目的调度、执行检测任务,保存检测结果等,是本发明所述监控系统的最核心后台子系统;核心数据库子系统:该子系统是整个监控系统的数据中心,是其它各子系统之间的联系纽带,主要包括代理信息库、监控项目库、检测任务结果库、账户管理库和权限管理库,该子系统的功能是组织、存储和管理整个监控系统的数据,并向其它子系统提供数据支持,具体是:存储监控项目执行子系统所得到的检测结果数据,给告警子系统提供最新的检测结果数据,给统计分析子系统提供过往的检测结果数据等;告警子系统,该子系统包括告警处理模块和告警信息库,该子系统的功能是按照设定的告警策略,对最新的检测结果数据进行分析,当所监控web服务器出现异常时,实现及时告警,并进行告警抑制,当所监控web服务器恢复正常时实现及时的告警清除;所述的告警策略包括监控项目告警分析前溯条数、监控项目告警产生抑制条数、监控项目告警清除抑制条数和监控项目的检测响应时间阀值等参数的设置;所述的监控项目告警分析前溯条数是指告警子系统在每次进行告警分析时要提取所设定前溯条数的最近检测结果,该监控项目告警分析前溯条数为系统所设定的大于等于1的自然数;所述的监控项目告警产生抑制条数是指即告警子系统只有连续分析到此抑制条数的表示监控项目出现错误的检测结果后才产生告警,该监控项目告警产生抑制条数为系统所设定的大于等于1的自然数;监控项目告警清除抑制条数是指告警子系统在监控项目异常前提下,连续分析到此条数的正常检测结果时才产生告警清除,该监控项目告警清除抑制条数为系统所设定的大于等于1的自然数;统计分析子系统:该子系统包括统计分析模块、监控报告通知模块和统计信息库,该子系统的功能是负责本发明所述监控系统的统计功能,具体是:统计检测结果数据,并保存在统计信息库中;定时生成监控报告,并发送给指定管理人员;统计的指标包括:监控项目可用率、监控项目检测平均响应时间、监控项目检测最长响应时间、监控项目检测最短响应时间、监控项目检测响应时间分布、不可用时间段、检测失败次数和累计故障总时长;通信子系统:该子系统包括短信模块、邮件模块和其他通信模块,该子系统的功能是为告警子系统和统计分析子系统提供各类通知途径,将告警子系统产生的告警信息通过短信、邮件或其它方式推送给用户,将统计分析子系统生成的监控报告发送给指定管理人员。
地址 310013 浙江省杭州市文三路398号4层