发明名称 |
用于改进多线程处理单元中的性能的技术 |
摘要 |
提供用于改进多线程处理单元中的性能的技术。多线程处理单元包括耦连到一个或多个处理引擎(例如拷贝引擎、GPC等)的硬件预处理器,其通过将任务分成较小子任务并基于任务的优先级在处理引擎上调度子任务来实现先占技术。通过限制子任务的大小,可快速执行较高优先级任务而不用切换处理引擎的上下文状态。可基于阈值大小或通过考虑诸如存储器系统的物理边界的其他因素来再分任务。 |
申请公布号 |
CN103729167A |
申请公布日期 |
2014.04.16 |
申请号 |
CN201310479294.6 |
申请日期 |
2013.10.14 |
申请人 |
辉达公司 |
发明人 |
桑缪尔·H·邓肯;加里·瓦尔德;M·瓦西乌·帕西德;林肯·G·加利克;沃伊切赫·简·特鲁缇 |
分类号 |
G06F9/38(2006.01)I;G06F9/50(2006.01)I |
主分类号 |
G06F9/38(2006.01)I |
代理机构 |
北京市磐华律师事务所 11336 |
代理人 |
董巍;谢栒 |
主权项 |
一种用于改进多线程处理引擎中的性能的计算机实现的方法,所述方法包括:接收要由处理引擎执行的第一任务;将所述第一任务分成子任务的第一集合,其中所述子任务的第一集合中的每个子任务小于阈值大小;发出来自所述子任务的第一集合的至少一个子任务到所述处理引擎用于处理;接收要由所述处理引擎执行的第二任务,其中所述第二任务比所述第一任务具有更高优先级;将所述第二任务分成子任务的第二集合,其中所述子任务的第二集合中的每个子任务小于所述阈值大小;通过在发出来自所述子任务的第一集合的所有子任务到所述处理引擎用于处理之前发出来自所述子任务的第二集合的至少一个子任务到所述处理引擎用于处理来先占所述第一任务;以及在发出来自所述子任务的第二集合的所述至少一个子任务到所述处理引擎之后,发出来自所述子任务的第一集合的至少一个附加子任务到所述处理引擎用于处理。 |
地址 |
美国加利福尼亚州 |