发明名称 | 具有减小的带宽要求的矩阵乘法 | ||
摘要 | 用于减小读取矩阵乘法运算的输入所需的带宽的系统和方法可改进系统性能。不是读取第一输入矩阵的行和第二输入矩阵的列以产生乘积矩阵的列,而是读取第一输入矩阵的列和第二输入矩阵的单个元素以产生乘积矩阵的部分点乘积的列。因此,经读取以产生每个乘积矩阵元素的输入矩阵元素的数目从2N减少到N+1,其中N为所述乘积矩阵的列中的元素的数目。 | ||
申请公布号 | CN101075185A | 申请公布日期 | 2007.11.21 |
申请号 | CN200710097456.4 | 申请日期 | 2007.04.29 |
申请人 | 辉达公司 | 发明人 | 诺伯特·朱法;约翰·R·尼科尔斯 |
分类号 | G06F9/38(2006.01) | 主分类号 | G06F9/38(2006.01) |
代理机构 | 北京律盟知识产权代理有限责任公司 | 代理人 | 王允方;刘国伟 |
主权项 | 1.一种执行包括用于多个线程或通道的传播操作数的一组运算的方法,其包含:获得由所述组运算包括的所述传播操作数规定的第一值;将所述第一值提供到多个程序指令执行单元;获得由所述组运算包括的并行操作数规定的一组第二值,其中所述第二值中的每一者均对应于所述多个线程或通道中的一者;将所述组第二值中的一个第二值提供到所述多个程序指令执行单元中的每一者;和针对所述多个线程或通道中的每一者执行所述组运算。 | ||
地址 | 美国加利福尼亚州 |