发明名称 一种基于视频图像判别的超级计算机房断电预警与自动开启的管理方法
摘要 本发明涉及一种基于视频图像判别的超级计算机房断电预警与自动管理方法,该方法基于捕获的视频监控图像,通过对图片进行综合分析,获取电源状态信息,从而对机房断电事故进行预警,并自动执行超级计算集群的关机,避免供电突然中断对机房高性能服务器的损坏,当供电恢复正常后,执行高性能计算集群开机功能,第一时间恢复计算运行,提供超级计算服务。本发明应用便捷、成本低廉,实现机房供电状态的预警与集群断电后的自动开关机,有效地保证了超级计算机房硬件设备与软件环境的安全运行,为更好地做好机房的运行维护工作提供了新的技术手段,可推广应用于科研院所、企事业单位、大型商业体等各类核心机房的供电状态监控与管理。
申请公布号 CN104267689A 申请公布日期 2015.01.07
申请号 CN201410485174.1 申请日期 2014.09.22
申请人 中国科学院寒区旱区环境与工程研究所 发明人 赵国辉;张耀南
分类号 G05B19/418(2006.01)I;H04N7/18(2006.01)I 主分类号 G05B19/418(2006.01)I
代理机构 兰州中科华西专利代理有限公司 62002 代理人 马正良
主权项 一种基于视频图像判别的超级计算机房断电预警与自动管理方法,其特征在于,包括以下步骤:步骤1:方法载体部署在由UPS(Uninterrupted Power System,不间断电源)供电的一台计算机上,该计算机为集群的管理服务器,拥有控制超级计算集群每台服务器的最高管理权限;步骤1:机房监控设备部署在机房与配电室具有供电设备的区域,对供电设备状态指示灯区域进行静态定位监控,监控系统由UPS供电,并可被管理服务器访问;步骤2:管理服务器自动获取视频监控画面,设定捕获照片时间间隔为<img file="839315dest_path_image001.GIF" wi="49" he="62" />,并自动把获得的视频监控图片,存放于管理服务器上,其<img file="648877dest_path_image001.GIF" wi="49" he="62" />取值范围为:<img file="420524dest_path_image002.GIF" wi="297" he="62" />;步骤3:自动读取已获取的图片文件进行信息分析,分析图片中供电设备指示灯的状态,从而判断机房的供电情况,其中指示灯状态亮灭状态包括四种情况:断电状态、正常状态、遮挡状态与监控设备故障,记录分析结果,并把结果传递给智能决策部分;步骤4:智能决策功能模块通过预定义的策略执行策略:断电预警,自动关机,来电重启与状态报告管理操作,同时对操作进行通告与记录; 步骤5:当断电事件发生后,管理服务器立即发出警报声音,并发送手机短信与邮件附带图片通知机房管理人员;步骤6:若管理人员在<img file="433479dest_path_image003.GIF" wi="87" he="62" />内,做出回应或者供电恢复正常,则关闭预警信息,恢复正常监控,否则,按照超级计算机房关机操作规范,管理服务器执行关机操作,并对本次断电与关机事件分别进行记录,其中<img file="315984dest_path_image004.GIF" wi="413" he="62" />;步骤7:恢复正常供电后,则按照超级计算机房管理规范,管理服务器自动执行来电重启操作,加载超级计算软件环境,提供计算服务,对本次事件进行记录,并发状态信息告知管理员。
地址 730000 甘肃省兰州市城关区东岗西路320号