发明名称 一种芯片级错误记录方法
摘要 本发明提出了一种芯片级错误记录方法,利用这种方法设计的芯片,使用层次化组织的错误寄存器集合来记录错误,并通过向系统内其他组件发中断及使能错误引脚等方式向外部系统报告错误;在记录错误时可区分及记录不同严重等级的错误,并可根据需要配置为使能或屏蔽某种类型的错误记录,其中,用来记录错误的局部和全局两种错误寄存器集合采用层次化结构来组织记录错误:使用局部错误寄存器集合来记录芯片内部某具体部件对应的错误;使用全局错误寄存器集合来汇总各局部错误寄存器集合中的错误记录,并向外部系统报告。
申请公布号 CN102681930A 申请公布日期 2012.09.19
申请号 CN201210149211.2 申请日期 2012.05.15
申请人 浪潮电子信息产业股份有限公司 发明人 乔英良
分类号 G06F11/34(2006.01)I 主分类号 G06F11/34(2006.01)I
代理机构 代理人
主权项 一种芯片级错误记录方法,其特征在于,局部错误寄存器和全局错误寄存器集合采用层次化结构来组织记录错误:使用局部错误寄存器集合来记录芯片内部某具体部件对应的错误;使用全局错误寄存器集合来汇总各局部错误寄存器集合中的错误记录,并向外部系统报告;局部错误寄存器集合包括1)局部错误状态寄存器、2)局部错误控制寄存器、3)局部错误严重等级寄存器、4)局部首次错误日志寄存器、5)局部后续错误日志寄存器;其中:1)局部错误状态寄存器,标识出对应部件中发生的每种错误,每种错误使用1bit表示,当发生某种类型的错误时,寄存器中对应的bit被置1;2)局部错误控制寄存器,控制是否记录对应部件错误产生的某种类型错误,其bit定义和局部错误状态寄存器各个位一一对应,如果局部错误控制寄存器中的某控制位被置位,则检测到的相应的错误会被屏蔽,不进行记录和处理;3)局部错误严重等级寄存器,提供把某种错误映射到多种错误严重等级的机制,发生对应错误时会根据错误严重等级寄存器中的错误种类‑严重等级映射关系的定义进行错误报告,假设需要支持如下3种错误严重等级:(1)可更正错误,是指系统能够恢复而没有信息的丢失,无需软件的参与的错误;包括链路CRC错误,能够通过链路层重传来更正;(2)可恢复错误是指无法通过硬件机制更正,需要通过上层软件恢复的错误;(3)致命错误,是指可能导致特定的事务不可靠,但系统仍能正常运行的错误,包括只影响事务的数据部分的ECC 不可纠正的错误、无法通过硬件或软件进行更正或恢复的错误,可能要求系统复位来恢复到可靠状态的错误,包括cache多位标记错、永久的PCI‑E链路失败;每种错误类型对应的严重等级需要用两个bit表示,设00b对应可更正错误、01b对应可恢复错误、10b对应致命错误、11b保留使用;4)局部首次错误日志寄存器,用来记录对应部件某种错误首次被检测到时的相应信息,包括报文内容、错误地址;5)局部后续错误日志寄存器,用来记录对应部件某种错误除第一次以外的后续发生时的相应信息,包括错误计数;全局错误寄存器集合包括全局错误状态寄存器1)、全局错误控制寄存器2)、全局首次错误日志寄存器3)、全局后续错误日志寄存器4)、系统事件状态寄存器5)和系统事件控制寄存器6),其中:全局错误状态寄存器1),标识出芯片内各个部件中发生错误与否,每个部件的错误状态使用1bit表示,当某个部件发生错误时,寄存器中对应的bit被置1;全局错误控制寄存器2),控制是否记录某个部件产生的错误,其bit定义和全局错误状态寄存器各个位一一对应,如果全局错误状态寄存器中的某控制位被置位,则检测到的相应部件的错误会被屏蔽,不进行记录和处理;全局首次错误日志寄存器3)和全局后续错误日志寄存器4)分别记录各个部件首次发生错误时及后续发生错误时的现场信息;系统事件状态寄存器5)记录芯片各个部件发生的错误对应的严重等级;系统事件控制寄存器6)定义严重等级‑报告方式的映射关系,可配置某种严重等级的错误向系统其他组件报告的方式,包括发中断、使能错误引脚;具体步骤如下:1)某部件产生某一类错误;2)判断是否在“局部错误控制寄存器”中是否已屏蔽该类错误,如果已屏蔽,则不记录该错误,结束;否则,设置“局部错误状态寄存器”中的对应bit;3)判断是否首次发生此类错误,如果是首次发生,则更新“局部首次错误日志寄存器”内容;否则,更新“局部后续错误日志寄存器”内容;4)根据“局部错误严重等级寄存器”中的配置向全局报告错误;5判断是否在“全局错误控制寄存器”中是否已屏蔽该部件相关错误,如果已屏蔽,则不记录该错误,结束;否则,设置“全局错误状态寄存器”中的对应bit;6)判断是否首次发生此部件相关错误,如果是首次发生,则更新“全局首次错误日志寄存器”内容;否则,更新“全局后续错误日志寄存器”内容;7)更新“系统事件状态寄存器”中的对应错误严重等级;8)根据“系统事件控制寄存器”中配置的严重等级‑报告方式映射关系,通过发中断、使能错误引脚等方式向外部系统报告错误,至此,整个错误记录及报告过程结束。
地址 250014 山东省济南市高新区舜雅路1036号