主权项 |
一种刀片服务器管理网络主动式检测方法, 其特征在于包括:1)刀片服务器各部件类型及连接方法;2)刀片服务器管理网络主动式自检机制;3)刀片服务器管理网络各模块自检方法,其中:1)在刀片服务器各部件类型及连接方法中,所述部件类型包括:(1)刀片模块BMC单元;(2)主、备管理模块SMC单元;所述部件连接方式包括:(1)刀片模块的BMC、管理模块的SMC间通过LAN方式链接;(2)主、备管理模块的SMC间通过HeartBeat和SMBus方式链接;2)刀片服务器管理网络主动式自检机制中,所述主动式,具体到管理模块不仅自身状态主动检测,也对被管理模块状态检测的主动查询;被管理模块自身状态主动检测;3)刀片服务器管理网络各模块自检方法,主动式检测是对管理模块和被管理模块进行不同的自检激励、自检执行实施;其中:管理模块自检激励包括:1)在SMC端启动自检服务进程;2)在SMC端通过LAN主动向BMC端发送主动查询检测指令;3)在SMC端建立自身回环检测;4)在主备SMC间建立基于心跳的检测机制;管理模块自检执行实施包括:1)SMC重启相应BMC;2)SMC重启自身IPMI服务主进程;3)状态异常的SMC会被对方重启,并进行备份状态;被管理模块自检激励包括:1)在BMC端启动自检服务进程2)在BMC端通过LAN主动向SMC端回复查询检测指令;3)在BMC端建立自身回环检测;被管理模块自检执行实施包括:1)BMC被SMC重启;2)BMC重启自身IPMI服务主进程;管理网络管理模块自检流程描述如下:步骤1:管理模块启动自检进程;步骤2:管理模块给自身建立IPMI Session;步骤3:管理模块给自身发送检测命令;步骤4: 若管理模块工作状态正常,则与各被管理模块建立IPMI Session,并发送主动查询检测命令;步骤5:若管理模块工作状态异常,则管理模块重启IPMI Main进程;步骤6:各被管理模块回复当前通信状况;步骤7:若通信状态正常,不做任何处理,准备启动下一次自检过程;步骤8:若通信状态异常,管理模块重启相应的被管理模块。 |