发明名称 |
经加速的通道间的向量归约指令 |
摘要 |
通过处理器执行向量归约指令,以提供对数据元素数组的高效归约操作。处理器包括多个向量寄存器。每个向量寄存器被划分成多个通道,并且每个通道存储相同数量的数据元素。该处理器还包括执行电路,该执行电路接收该向量归约指令,该向量归约指令用于利用归约运算符将源操作数中存储的数据元素的数组归约成目的地操作数中的结果。源操作数和目的地操作数中的每一个是多个向量寄存器中的一个向量寄存器。响应于该向量归约指令,执行电路将归约运算符应用于每个通道中的数据元素中的两个数据元素,并在每个通道中余下至少一个数据元素时移动一个或多个余下的数据元素。 |
申请公布号 |
CN104603766A |
申请公布日期 |
2015.05.06 |
申请号 |
CN201380045404.6 |
申请日期 |
2013.06.10 |
申请人 |
英特尔公司 |
发明人 |
P·卡普瑞奥利;A·S·卡尼尔;J·J·库克;M·M·艾尔-奥图姆 |
分类号 |
G06F13/16(2006.01)I;G06F9/30(2006.01)I |
主分类号 |
G06F13/16(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
何焜 |
主权项 |
一种装置,包括:多个向量寄存器,其中每个向量寄存器被划分成多个通道,并且每个通道存储相同数量的数据元素;以及执行电路,耦合至所述多个向量寄存器,所述执行电路用于:接收向量归约指令,所述向量归约指令用于利用归约运算符将源操作数中存储的数据元素的数组归约成目的地操作数中的结果,其中所述源操作数和所述目的地操作数中的每一个是所述多个向量寄存器中的一个向量寄存器,响应于所述向量归约指令,将所述归约运算符应用于每个通道中的所述数据元素中的两个数据元素,并在每个通道中余下至少一个数据元素时移位一个或多个余下的数据元素。 |
地址 |
美国加利福尼亚州 |