发明名称 一种刀片服务器管理网络主动式检测方法
摘要 本发明一种刀片服务器管理网络主动式检测方法,通过对刀片服务器关键部件增加自检机制,保证当服务器管理网络出现通信失效时具备主动处理能力。从管理模块和被管理模块两方面增加主动检测,并提供模块间的检测机制,大大提高了刀片服务器管理网络的强壮性和可用性,也促进了大规模服务器集群网络管理能力的提升。
申请公布号 CN103428033A 申请公布日期 2013.12.04
申请号 CN201310363663.5 申请日期 2013.08.20
申请人 浪潮电子信息产业股份有限公司 发明人 陈刚
分类号 H04L12/24(2006.01)I;H04L12/26(2006.01)I;H04L29/08(2006.01)I 主分类号 H04L12/24(2006.01)I
代理机构 代理人
主权项 一种刀片服务器管理网络主动式检测方法, 其特征在于包括:1)刀片服务器各部件类型及连接方法;2)刀片服务器管理网络主动式自检机制;3)刀片服务器管理网络各模块自检方法,其中:1)在刀片服务器各部件类型及连接方法中,所述部件类型包括:(1)刀片模块BMC单元;(2)主、备管理模块SMC单元;所述部件连接方式包括:(1)刀片模块的BMC、管理模块的SMC间通过LAN方式链接;(2)主、备管理模块的SMC间通过HeartBeat和SMBus方式链接;2)刀片服务器管理网络主动式自检机制中,所述主动式,具体到管理模块不仅自身状态主动检测,也对被管理模块状态检测的主动查询;被管理模块自身状态主动检测;3)刀片服务器管理网络各模块自检方法,主动式检测是对管理模块和被管理模块进行不同的自检激励、自检执行实施;其中:管理模块自检激励包括:1)在SMC端启动自检服务进程;2)在SMC端通过LAN主动向BMC端发送主动查询检测指令;3)在SMC端建立自身回环检测;4)在主备SMC间建立基于心跳的检测机制;管理模块自检执行实施包括:1)SMC重启相应BMC;2)SMC重启自身IPMI服务主进程;3)状态异常的SMC会被对方重启,并进行备份状态;被管理模块自检激励包括:1)在BMC端启动自检服务进程2)在BMC端通过LAN主动向SMC端回复查询检测指令;3)在BMC端建立自身回环检测;被管理模块自检执行实施包括:1)BMC被SMC重启;2)BMC重启自身IPMI服务主进程;管理网络管理模块自检流程描述如下:步骤1:管理模块启动自检进程;步骤2:管理模块给自身建立IPMI Session;步骤3:管理模块给自身发送检测命令;步骤4: 若管理模块工作状态正常,则与各被管理模块建立IPMI Session,并发送主动查询检测命令;步骤5:若管理模块工作状态异常,则管理模块重启IPMI Main进程;步骤6:各被管理模块回复当前通信状况;步骤7:若通信状态正常,不做任何处理,准备启动下一次自检过程;步骤8:若通信状态异常,管理模块重启相应的被管理模块。
地址 250014 山东省济南市高新区舜雅路1036号