发明名称 一种面向超级计算机的分布式层次化自主监控管理系统
摘要 本发明提供了一种面向超级计算机的分布式层次化自主监控管理系统,将大规模超级计算机管理系统进行逻辑分区;在分区内部通过构建多层次自主元素实现自主管理。监控管理系统MMS实现对系统资源管理,告警信息管理和系统配置信息的管理,系统管理员通过监控管理软件可以了解系统当前的健康状况、使用情况和功耗及运行环境状态。同时系统采用统一监控管理策略从而实现统一的分布式管理。
申请公布号 CN105975378A 申请公布日期 2016.09.28
申请号 CN201610307721.6 申请日期 2016.05.11
申请人 国网江苏省电力公司;北京中电普华信息技术有限公司 发明人 王纪军;谭晶;高莉莎;张辉;徐宏志;梁俊锋;李兴
分类号 G06F11/30(2006.01)I 主分类号 G06F11/30(2006.01)I
代理机构 北京远创理想知识产权代理事务所(普通合伙) 11513 代理人 卫安乐
主权项 一种面向超级计算机的分布式层次化自主监控管理系统,其特征在于:监控管理系统采用分布式系统结构,分为三个层次,底层结点由所有的被管理设备组成,中间层包括多个中间代理,最顶层是多个管理结点,最底层的每个结点上运行一个信息采集模块daemon,负责采集结点的资源信息,包括结点配置、结点资源使用情况,结点负载,结点的用户及进程信息;监控管理系统提供基于web的用户访问界面,管理员在远程或本地访问MMS,MMS实现了对系统资源管理,告警信息管理和系统配置信息的管理,资源管理是MMS的主要功能之一资源管理包括软件资源信息和硬件信息,软件资源主要包括系统资源、结点状态和全局存储信息,系统资源主要包括系统所有结点的状态和作业信息,包括结点是否空闲和可用、作业的运行状态、排队状态,结点状态包括单个结点上的可用资源例如CPU、内存的利用率,全局存储信息主要显示全局存储资源的使用和健康状态,硬件信息主要包括电压、温度、风扇信息、运行环境相关信息和系统功耗管理,系统管理员通过监控管理软件了解系统当前的健康状况、使用情况和功耗及运行环境状态;监控管理系统采用统一监控管理策略,所述统一监控管理策略内容如下:策略分类:依据全局监控管理策略划分为若干类别,包括:交换机、磁盘阵列、操作系统、磁带库、数据库、硬件信息;策略抽象:各层次自主元素从同一类型不同厂商产品的监控管理策略中,抽象出该类型产品的统一监控管理策略格式;策略描述:在上述监控管理策略分类的基础上,各层次自主元素实现对各个种类的监控管理策略进行统一描述;策略组合:将监控管理策略分为直接策略和间接策略两种,其中,直接策略是通过策略转换直接实施到具体设备或应用上的,而间接策略则由一组直接策略或间接策略组合而成;策略配置:实现将统一策略转换为具体设备策略的监控管理策略处理模块,另外再实现将具体设备策略分发到设备或应用上的设备监管驱动和中间代理模块。
地址 210000 江苏省南京市上海路215号