发明名称 利用网络介质链接状态功能来提高计算机集群系统可用性的方法
摘要 本发明用于计算机集群系统,本发明是一种当系统中一台服务器(220)运行失败时,用于增强另一台服务器(210)的可用性的方法。在集群系统中,每台服务器(210,220)都有一个附属的大容量存储设备(214,224),并且每台服务器(210,220)都可以处理来自集群系统中任何网络设备(230,240,250)的请求。在服务器(210,220)的大容量存储设备(214,224)中的数据互为镜像,这样每台服务器的大容量存储设备中都保存有整个集群系统数据的一个完整备份。建立数据镜像的过程通过服务器间的一个专用链路(202)实现,这样可以减少集群系统中其他部分发生拥塞的情况。当第一台服务器(210)检测到发生来自第二台服务器(220)的通讯数据丢失的情况时,第一台服务器(210)判断是否是由于专用链路(202)的故障导致了通讯数据丢失。如果专用链路(202)运行失败,第一台服务器停止运行,以避免将数据写入其相连的大容量存储设备(214),因为这些数据由于通讯的丢失将不能被建立镜像。如果专用链路(202)可以正常运行,第一台服务器(210)继续运行。在上述两种情况下,因为每台服务器(210,220)都可以处理来自任何网络设备(230,240,250)的请求,并且每台服务器都有整个网络数据的完整拷贝,因此,即使一台服务器被关闭,整个集群系统仍然可以正常使用。
申请公布号 CN1264092C 申请公布日期 2006.07.12
申请号 CN01821130.5 申请日期 2001.12.19
申请人 EMC公司 发明人 丹尼尔·M·普里塞
分类号 G06F11/00(2006.01);G06F11/20(2006.01);G06F11/30(2006.01);G06F11/14(2006.01);G06F11/16(2006.01) 主分类号 G06F11/00(2006.01)
代理机构 北京康信知识产权代理有限责任公司 代理人 余刚;李丙林
主权项 1.一种提高包括通过通讯链路相连的第一服务器和第二服务器的计算机集群系统可用性和可靠性的方法,其中所述计算机集群中一旦出现中断的情况,所述第二服务器被赋予生存权;所述方法包括下列动作:所述第一服务器通过所述通讯链路在所述第一服务器的大容量存储设备与所述第二服务器的大容量存储设备之间建立镜像;所述第一服务器检测在所述通讯链路上那些阻碍了第一服务器与第二服务器之间建立数据镜像的从所述第二服务器到所述第一服务器的通讯丢失;所述第一服务器分析通讯链路以确定通讯链路是否正常工作;如果判定通讯链路能够正常工作,则所述第一服务器执行下列动作:继续运行;不与第二服务器、或第一服务器的大容量存储设备、或第二服务器的大容量存储设备进行通讯就承担生存权;以及令第一服务器的网络接口为网络设备发送到所述第二服务器的请求提供服务;以及如果判定通讯链路不能正常工作,则所述第一服务器停止运行。
地址 美国马赛诸塞