发明名称 |
一种深度卷积神经网络训练方法及装置 |
摘要 |
本发明涉及深度学技术领域,特别涉及一种深度卷积神经网络训练方法及装置。所述深度卷积神经网络训练方法包括:步骤a:在大规模源数据集上对DCNN进行预训练,并对所述DCNN进行模型剪枝;步骤b:在剪枝过的DCNN上进行迁移学;步骤c:利用小规模目标数据集对迁移后的DCNN进行模型压缩。本发明利用迁移学方法与模型压缩技术的优势互补,在大规模源数据集到小规模目标数据集的迁移学过程中,对DCNN进行模型压缩与剪枝,从而改善迁移学能力,以降低DCNN在小规模目标数据集上的过拟合风险与部署难度,提高模型在目标数据集上的预测能力。 |
申请公布号 |
CN106355248A |
申请公布日期 |
2017.01.25 |
申请号 |
CN201610738135.7 |
申请日期 |
2016.08.26 |
申请人 |
深圳先进技术研究院 |
发明人 |
乔宇;刘家铭;王亚立 |
分类号 |
G06N3/08(2006.01)I;G06N3/06(2006.01)I |
主分类号 |
G06N3/08(2006.01)I |
代理机构 |
深圳市科进知识产权代理事务所(普通合伙) 44316 |
代理人 |
赵勍毅 |
主权项 |
一种深度卷积神经网络训练方法,其特征在于,包括以下步骤:步骤a:在大规模源数据集上对DCNN进行预训练,并对所述DCNN进行模型剪枝;步骤b:在剪枝过的DCNN上进行迁移学习;步骤c:利用小规模目标数据集对迁移后的DCNN进行模型压缩。 |
地址 |
518055 广东省深圳市南山区西丽大学城学苑大道1068号 |