发明名称 |
神经网络模型压缩方法以及装置 |
摘要 |
本发明公开了一种神经网络模型压缩方法以及装置。其中方法包括:针对神经网络模型中的每一个神经元层,确定每个神经元层的模型参数集合,其中,模型参数集合包含多个模型参数;对多个模型参数进行第一变换以生成多个中间参数;根据预设的量化步长对多个中间参数进行量化,得到多个量化参数;根据预设的量化位数,从多个量化参数中选取多个采样量化点;根据多个量化参数的值和多个采样量化点,生成多个模型参数的量化值;根据量化值对多个模型参数进行压缩存储。该方法可以更好地保持模型效果,大大减少了神经网络模型的大小,减少了计算资源,特别是减少了内存资源的占用。 |
申请公布号 |
CN106485316A |
申请公布日期 |
2017.03.08 |
申请号 |
CN201610943049.X |
申请日期 |
2016.10.31 |
申请人 |
北京百度网讯科技有限公司 |
发明人 |
朱志凡;冯仕堃;周坤胜;石磊;何径舟 |
分类号 |
G06N3/02(2006.01)I;G06N3/06(2006.01)I;H03M1/54(2006.01)I;H03M1/38(2006.01)I |
主分类号 |
G06N3/02(2006.01)I |
代理机构 |
北京清亦华知识产权代理事务所(普通合伙) 11201 |
代理人 |
宋合成 |
主权项 |
一种神经网络模型压缩方法,其特征在于,包括以下步骤:针对神经网络模型中的每一个神经元层,确定所述每个神经元层的模型参数集合,其中,所述模型参数集合包含多个模型参数;对所述多个模型参数进行第一变换以生成多个中间参数;根据预设的量化步长对所述多个中间参数进行量化,得到多个量化参数;根据预设的量化位数,从所述多个量化参数中选取多个采样量化点;根据所述多个量化参数的值和所述多个采样量化点,生成所述多个模型参数的量化值;根据所述量化值对所述多个模型参数进行压缩存储。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦2层 |