发明名称 |
处理器和用于在处理器上执行矩阵乘运算的方法 |
摘要 |
本申请公开了处理器和用于在处理器上执行矩阵乘运算的方法。所述处理器的一具体实施方式包括数据总线以及由k个处理单元组成的阵列处理机,其中:所述数据总线,用于依次从M×N的被乘数矩阵中读取n列的行向量并输入至所述阵列处理机中的每个处理单元、从N×K的乘数矩阵中读取n×k的子矩阵并将所述子矩阵的每个列向量输入至所述阵列处理机中对应的处理单元以及将每个处理单元执行乘运算所得到的结果输出;所述阵列处理机中的每个处理单元,用于并行对输入的行向量以及列向量执行向量乘运算,每个处理单元包括由n个乘法器和n‑1个加法器组成的华莱士树乘法器。该实施方式提高了矩阵乘运算的处理效率。 |
申请公布号 |
CN106445471A |
申请公布日期 |
2017.02.22 |
申请号 |
CN201610894738.6 |
申请日期 |
2016.10.13 |
申请人 |
北京百度网讯科技有限公司 |
发明人 |
周妮;漆维;王勇;欧阳剑 |
分类号 |
G06F9/302(2006.01)I |
主分类号 |
G06F9/302(2006.01)I |
代理机构 |
北京英赛嘉华知识产权代理有限责任公司 11204 |
代理人 |
王达佐;马晓亚 |
主权项 |
一种处理器,其特征在于,所述处理器包括数据总线以及由k个处理单元组成的阵列处理机,其中:所述数据总线,用于依次从M×N的被乘数矩阵中读取n列的行向量并输入至所述阵列处理机中的每个处理单元、从N×K的乘数矩阵中读取n×k的子矩阵并将所述子矩阵的每个列向量输入至所述阵列处理机中对应的处理单元以及将每个处理单元执行乘运算所得到的结果输出;所述阵列处理机中的每个处理单元,用于并行对输入的行向量以及列向量执行向量乘运算,每个处理单元包括由n个乘法器和n‑1个加法器组成的华莱士树乘法器;其中,n、k、M、N均为大于1的整数。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦2层 |