神经网络模型压缩方法以及装置,申请号CN201610943049.X-传众专利搜索

发明名称	神经网络模型压缩方法以及装置
摘要	本发明公开了一种神经网络模型压缩方法以及装置。其中方法包括：针对神经网络模型中的每一个神经元层，确定每个神经元层的模型参数集合，其中，模型参数集合包含多个模型参数；对多个模型参数进行第一变换以生成多个中间参数；根据预设的量化步长对多个中间参数进行量化，得到多个量化参数；根据预设的量化位数，从多个量化参数中选取多个采样量化点；根据多个量化参数的值和多个采样量化点，生成多个模型参数的量化值；根据量化值对多个模型参数进行压缩存储。该方法可以更好地保持模型效果，大大减少了神经网络模型的大小，减少了计算资源，特别是减少了内存资源的占用。
申请公布号	CN106485316A	申请公布日期	2017.03.08
申请号	CN201610943049.X	申请日期	2016.10.31
申请人	北京百度网讯科技有限公司	发明人	朱志凡;冯仕堃;周坤胜;石磊;何径舟
分类号	G06N3/02(2006.01)I;G06N3/06(2006.01)I;H03M1/54(2006.01)I;H03M1/38(2006.01)I	主分类号	G06N3/02(2006.01)I
代理机构	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人	宋合成
主权项	一种神经网络模型压缩方法，其特征在于，包括以下步骤：针对神经网络模型中的每一个神经元层，确定所述每个神经元层的模型参数集合，其中，所述模型参数集合包含多个模型参数；对所述多个模型参数进行第一变换以生成多个中间参数；根据预设的量化步长对所述多个中间参数进行量化，得到多个量化参数；根据预设的量化位数，从所述多个量化参数中选取多个采样量化点；根据所述多个量化参数的值和所述多个采样量化点，生成所述多个模型参数的量化值；根据所述量化值对所述多个模型参数进行压缩存储。
地址	100085 北京市海淀区上地十街10号百度大厦2层