发明名称 |
在图形处理单元上训练卷积神经网络 |
摘要 |
在图形处理单元上实现一卷积神经网络。然后,卷积神经网络通过一系列正向传递和反向传递来进行训练,其中卷积核和偏差矩阵在每一次反向传递中根据误差函数的梯度得到修正。该实现利用图形处理单元中的像素遮蔽单元的并行处理性能,并利用一组逐步推导的公式对像素遮蔽单元的计算进行编程。程序通过纹理来完成输入和输出,并且使用一多级求和运算过程对各像素遮蔽单元寄存器进行求和运算。 |
申请公布号 |
CN101253493B |
申请公布日期 |
2012.04.25 |
申请号 |
CN200680031305.2 |
申请日期 |
2006.08.17 |
申请人 |
微软公司 |
发明人 |
S·普里 |
分类号 |
G06F15/18(2006.01)I;G06F15/00(2006.01)I |
主分类号 |
G06F15/18(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
陈斌 |
主权项 |
一种训练卷积神经网络以利用能够由图形处理单元GPU以及一个或多个GPU可执行程序读取的图形数据来识别图像的计算机实现的方法,所述方法包括:准备所述图形数据,所述图形数据表示所述卷积神经网络的状态且包括表示一个或多个神经网络变量的一个或多个纹理,所述一个或多个纹理包括二维纹理,至少一个或多个所述纹理表示一个超过二维的神经网络变量,该神经网络变量已被扁平化为二维,所述卷积神经网络包括至少一层,所述至少一层包括多个片;在GPU上执行一个或多个GPU可执行程序,以在所述卷积神经网络中进行一正向传递,该执行包括对所述多个片进行卷积操作;在GPU上执行一个或多个GPU可执行程序,以在所述卷积神经网络中进行一反向传递,该执行包括对所述多个片进行卷积操作;在GPU上执行一个或多个GPU可执行程序,以基于反向传递的结果修正所述图形数据;以及重复执行一个或多个GPU可执行程序,以进行正向传递、反向传递和修正所述图形数据,直到所述卷积神经网络得到训练。 |
地址 |
美国华盛顿州 |