发明名称 |
数据矩阵相乘的加速运算方法和装置 |
摘要 |
本发明公开了一种数据矩阵相乘的加速运算方法和装置。其中,该数据矩阵相乘的加速运算方法包括:根据显存容量和待求解矩阵的数据量确定计算待求解矩阵的数据量的单次计算数据量上限;根据数据量上限和待求解矩阵的维度对待求解矩阵进行划分操作,得到多个数据块,其中,每个数据块的数据量小于等于数据量上限;在统一计算设备架构平台上构建线程和线程块的计算结构;在计算结构中依次对多个数据块进行并行运算;以及累计由计算结构依次输出的多个数据块的运算结果。通过本发明,解决了现有技术中进行矩阵相乘的加速运算时引入误差而导致计算结果不准确的问题,达到了提高运算速度的同时保证运算结果的准确的效果。 |
申请公布号 |
CN104572587A |
申请公布日期 |
2015.04.29 |
申请号 |
CN201410815244.5 |
申请日期 |
2014.12.23 |
申请人 |
中国电子科技集团公司第三十八研究所 |
发明人 |
魏一雄;张祥祥;田富君;程五四;陈帝江;胡祥涛;张红旗 |
分类号 |
G06F17/16(2006.01)I |
主分类号 |
G06F17/16(2006.01)I |
代理机构 |
北京康信知识产权代理有限责任公司 11240 |
代理人 |
吴贵明;张永明 |
主权项 |
一种数据矩阵相乘的加速运算方法,其特征在于,包括:根据显存容量和待求解矩阵的数据量确定计算所述待求解矩阵的数据量的单次计算数据量上限;根据所述数据量上限和所述待求解矩阵的维度对所述待求解矩阵进行划分操作,得到多个数据块,其中,每个所述数据块的数据量小于等于所述数据量上限;在统一计算设备架构平台上构建线程和线程块的计算结构;在所述计算结构中依次对所述多个数据块进行并行运算;以及累计由所述计算结构依次输出的所述多个数据块的运算结果。 |
地址 |
230088 安徽省合肥市高新区香樟大道199号 |