发明名称 一种并行计算机系统管理控制器的容错备份方法及系统
摘要 本发明公开了一种用于并行计算机的系统管理控制器的容错备份原理与方法,将并行计算机系统分成若干个主板组,每一个主板组由一个系统管理控制器eSMC负责执行其监控和管理任务,每两个系统管理控制器eSMC构成一组,其中一个系统管理控制器eSMC将所有的监控和管理部件挂接在一条I<SUP>2</SUP>C总线上,该I<SUP>2</SUP>C总线同时与另一个系统管理控制器eSMC相连,当其中一个系统管理控制器eSMC宕机时,另一个系统管理控制器eSMC将通过I<SUP>2</SUP>C总线接管其所有的监控和管理部件。本发明用以解决并行计算机系统中系统管理控制器的可靠性问题,同时缓解高性能计算机系统的高可用性和低成本之间的冲突。
申请公布号 CN101178673A 申请公布日期 2008.05.14
申请号 CN200710192606.X 申请日期 2007.12.14
申请人 中国人民解放军国防科学技术大学 发明人 刘光明;蒋句平;屈婉霞;田宝华;郑明玲;徐炜遐;窦强;曹跃胜;罗莉;张俊;郑义;夏军
分类号 G06F11/00(2006.01);H04L12/24(2006.01) 主分类号 G06F11/00(2006.01)
代理机构 湖南兆弘专利事务所 代理人 赵洪
主权项 1.一种并行计算机系统管理控制器的容错备份方法,其特征在于:将并行计算机系统分成若干个主板组,每一个主板组由一个系统管理控制器eSMC负责执行其监控和管理任务,每两个系统管理控制器eSMC构成一组,其中一个系统管理控制器eSMC将所有的监控和管理部件挂接在一条I2C总线上,该I2C总线同时与另一个系统管理控制器eSMC相连,当其中一个系统管理控制器eSMC宕机时,另一个系统管理控制器eSMC将通过I2C总线接管其所有的监控和管理部件。
地址 410073湖南省长沙市砚瓦池正街47号中国人民解放军国防科学技术大学计算机学院计算机研究所