发明名称 用于深度学模型的矩阵压缩方法和装置
摘要 本发明的实施方式提供了一种用于深度学模型的矩阵压缩方法和装置,其中所述深度学模型的最后一层线性层连接M个隐节点和N个分类节点,所述最后一层线性层对应有权重矩阵W。所述方法包括:步骤S101:根据所述权重矩阵W的元素的绝对值,计算K值;以及步骤S102:将所述最后一层线性层分解为第一线性层和第二线性层,其中所述第一线性层的权重矩阵为M*K的矩阵P,所述第二线性层的权重矩阵为K*N的矩阵Q,所述第一线性层的输出为所述第二线性层的输入,且M*N>K*(M+N),以将所述权重矩阵W压缩。
申请公布号 CN105184369A 申请公布日期 2015.12.23
申请号 CN201510566639.0 申请日期 2015.09.08
申请人 杭州朗和科技有限公司 发明人 陈海波;李晓燕
分类号 G06N3/08(2006.01)I 主分类号 G06N3/08(2006.01)I
代理机构 北京市中伦律师事务所 11410 代理人 贾媛媛;张思悦
主权项 一种用于深度学习模型的矩阵压缩方法,其中所述深度学习模型的最后一层线性层连接M个隐节点和N个分类节点,所述最后一层线性层的权重矩阵<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>W</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>w</mi><mn>11</mn></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>w</mi><mrow><mn>1</mn><mi>N</mi></mrow></msub></mtd></mtr><mtr><mtd><mrow></mrow></mtd><mtd><mo>...</mo></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><msub><mi>w</mi><mrow><mi>M</mi><mn>1</mn></mrow></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>w</mi><mrow><mi>M</mi><mi>N</mi></mrow></msub></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000798108760000011.GIF" wi="478" he="232" /></maths>所述方法包括:步骤S101:根据所述权重矩阵W的元素的绝对值,计算K值;以及步骤S102:将所述最后一层线性层分解为第一线性层和第二线性层,其中所述第一线性层的权重矩阵为M*K的矩阵<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>P</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>p</mi><mn>11</mn></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>p</mi><mrow><mn>1</mn><mi>K</mi></mrow></msub></mtd></mtr><mtr><mtd><mrow></mrow></mtd><mtd><mo>...</mo></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><msub><mi>p</mi><mrow><mi>M</mi><mn>1</mn></mrow></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>p</mi><mrow><mi>M</mi><mi>K</mi></mrow></msub></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000798108760000012.GIF" wi="456" he="230" /></maths>所述第二线性层的权重矩阵为K*N的矩阵<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>Q</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>q</mi><mn>11</mn></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>q</mi><mrow><mn>1</mn><mi>N</mi></mrow></msub></mtd></mtr><mtr><mtd><mrow></mrow></mtd><mtd><mo>...</mo></mtd><mtd><mrow></mrow></mtd></mtr><mtr><mtd><msub><mi>q</mi><mrow><mi>K</mi><mn>1</mn></mrow></msub></mtd><mtd><mrow></mrow></mtd><mtd><msub><mi>q</mi><mrow><mi>K</mi><mi>N</mi></mrow></msub></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000798108760000013.GIF" wi="438" he="229" /></maths>所述第一线性层的输出为所述第二线性层的输入,且M*N&gt;K*(M+N),以将所述权重矩阵W压缩。
地址 310052 浙江省杭州市滨江区长河街道网商路599号4幢301室