主权项 |
一种用于深度学习模型的矩阵压缩方法,其中所述深度学习模型的最后一层线性层连接M个隐节点和N个分类节点,所述最后一层线性层的权重矩阵<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>W</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>w</mi><mn>11</mn></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>w</mi><mrow><mn>1</mn><mi>N</mi></mrow></msub></mtd></mtr><mtr><mtd><mrow></mrow></mtd><mtd><mo>...</mo></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><msub><mi>w</mi><mrow><mi>M</mi><mn>1</mn></mrow></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>w</mi><mrow><mi>M</mi><mi>N</mi></mrow></msub></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000798108760000011.GIF" wi="478" he="232" /></maths>所述方法包括:步骤S101:根据所述权重矩阵W的元素的绝对值,计算K值;以及步骤S102:将所述最后一层线性层分解为第一线性层和第二线性层,其中所述第一线性层的权重矩阵为M*K的矩阵<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>P</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>p</mi><mn>11</mn></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>p</mi><mrow><mn>1</mn><mi>K</mi></mrow></msub></mtd></mtr><mtr><mtd><mrow></mrow></mtd><mtd><mo>...</mo></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><msub><mi>p</mi><mrow><mi>M</mi><mn>1</mn></mrow></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>p</mi><mrow><mi>M</mi><mi>K</mi></mrow></msub></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000798108760000012.GIF" wi="456" he="230" /></maths>所述第二线性层的权重矩阵为K*N的矩阵<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>Q</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>q</mi><mn>11</mn></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>q</mi><mrow><mn>1</mn><mi>N</mi></mrow></msub></mtd></mtr><mtr><mtd><mrow></mrow></mtd><mtd><mo>...</mo></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><msub><mi>q</mi><mrow><mi>K</mi><mn>1</mn></mrow></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>q</mi><mrow><mi>K</mi><mi>N</mi></mrow></msub></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000798108760000013.GIF" wi="438" he="229" /></maths>所述第一线性层的输出为所述第二线性层的输入,且M*N>K*(M+N),以将所述权重矩阵W压缩。 |