发明名称 一种深度卷积神经网络训练方法及装置
摘要 本发明涉及深度学技术领域,特别涉及一种深度卷积神经网络训练方法及装置。所述深度卷积神经网络训练方法包括:步骤a:在大规模源数据集上对DCNN进行预训练,并对所述DCNN进行模型剪枝;步骤b:在剪枝过的DCNN上进行迁移学;步骤c:利用小规模目标数据集对迁移后的DCNN进行模型压缩。本发明利用迁移学方法与模型压缩技术的优势互补,在大规模源数据集到小规模目标数据集的迁移学过程中,对DCNN进行模型压缩与剪枝,从而改善迁移学能力,以降低DCNN在小规模目标数据集上的过拟合风险与部署难度,提高模型在目标数据集上的预测能力。
申请公布号 CN106355248A 申请公布日期 2017.01.25
申请号 CN201610738135.7 申请日期 2016.08.26
申请人 深圳先进技术研究院 发明人 乔宇;刘家铭;王亚立
分类号 G06N3/08(2006.01)I;G06N3/06(2006.01)I 主分类号 G06N3/08(2006.01)I
代理机构 深圳市科进知识产权代理事务所(普通合伙) 44316 代理人 赵勍毅
主权项 一种深度卷积神经网络训练方法,其特征在于,包括以下步骤:步骤a:在大规模源数据集上对DCNN进行预训练,并对所述DCNN进行模型剪枝;步骤b:在剪枝过的DCNN上进行迁移学习;步骤c:利用小规模目标数据集对迁移后的DCNN进行模型压缩。
地址 518055 广东省深圳市南山区西丽大学城学苑大道1068号