发明名称 一种高可用集群计算机系统及其故障处理方法
摘要 本发明公开了一种高可用集群计算机系统,所述系统包括管理节点和服务节点,其中管理节点包括服务器端和代理端,服务节点包括综合前端应用服务器,所述服务器端根据安装在所述应用服务器的代理端收集的状态信息进行故障监控,并根据监控得到的服务节点的状态信息控制主服务节点和备用服务节点进行切换。相应地,本发明还提供了应用所述高可用集群计算机系统进行故障处理的方法。本发明的集群系统的冗余度仅取决于备用服务节点的数目,而且应用系统与故障监控及切换处理相关模块为松耦合,对系统的性能影响较小,并且系统部署方便,成本较低。
申请公布号 CN102231681B 申请公布日期 2014.07.30
申请号 CN201110180749.5 申请日期 2011.06.27
申请人 中国建设银行股份有限公司 发明人 卜天奇;周子坚;胡宏;杜永健;杨志勇
分类号 H04L12/24(2006.01)I;H04L29/08(2006.01)I 主分类号 H04L12/24(2006.01)I
代理机构 广州三环专利代理有限公司 44202 代理人 温旭;郝传鑫
主权项 一种高可用集群计算机系统,其特征在于,所述系统包括管理节点和服务节点,其中服务节点包括综合前端应用服务器,所述服务节点分为一个以上主服务节点和一个以上备用服务节点,管理节点包括服务器端和代理端,其中,所述服务器端,用于根据安装在所述应用服务器的代理端收集的状态信息进行故障监控,并根据监控得到的服务节点的状态信息控制主服务节点和备用服务节点进行切换,其中,所述状态信息为在所述代理端上进行的心跳检测和健康检查所采集的服务节点的状态信息,所述心跳检测用于检查应用服务器的基础环境是否处于正常状态,所述健康检查用于检查综合前端应用是否正常,其中,所述主服务节点配置有固定IP、浮动IP和底层控制台IP,所述备用服务节点配置有固定IP和底层控制台IP,所述服务器端包括:主备切换模块,当所述主服务节点故障时,用于实现如下功能:通过底层控制台IP关闭所述故障服务节点,通过备用服务节点的固定IP登录到备用服务节点,启动所述故障服务节点的浮动IP完成主备切换,并记录该备用服务节点所接管的故障服务节点的固定IP,其中通过底层控制台IP关闭所述故障服务节点是通过HP服务器的ilo管理命令;回切模块,当所述故障服务节点恢复时,用于实现如下功能:根据所述故障服务节点的固定IP查找所述主备切换对应的备用服务节点,在所述备用服务节点上关闭所述浮动IP,并在恢复的所述故障服务节点重启所述浮动IP以重新开始运作。
地址 100032 北京市西城区金融大街25号