发明名称 基于混合深度结构的场景识别方法
摘要 本发明公开了一种基于混合深度结构的场景识别方法。改进先前混合深度识别框架,运用到场景识别的任务中,使用深度自编码器自动提取局部图像块特征代替传统混合深度网络的局部特征提取层,得到图像块高级局部特征。同时引入空间信息改进场景识别的局部特征编码层,最后使用深度判别网络识别场景,完善混合深度混合场景识别框架,使改进的混合深度场景在形式上和识别准确率上接近卷积神经网络的,计算效率上高于深度卷积神经网络。此外针对场景数据类内差异性和类间相似性有选择扩充场景数据,构建鲁棒性高,适应小数据集的深度混合场景识别模型。
申请公布号 CN106203354A 申请公布日期 2016.12.07
申请号 CN201610554626.6 申请日期 2016.07.14
申请人 南京信息工程大学 发明人 胡昭华;姜啸远;钱坤;王珏
分类号 G06K9/00(2006.01)I;G06N3/02(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 南京纵横知识产权代理有限公司 32224 代理人 董建林
主权项 基于混合深度结构的场景识别方法,其特征在于,包括如下步骤:步骤一:在图片中随机抽取若干图像块后,对图像块标准化;步骤二:从数据集中随机抽取若干图片,对每张图片抽取图像块,将图片块不计类别混合,归一化后分别训练两个深度直连卷积自编码器网络;步骤三:深度直连卷积自编码特征提取,编码过程中的任一层都可视为特征层,特征层输出有多个特征映射矩阵,串联特征映射矩阵相同位置的值得到图像块的局部特征;步骤四:将步骤三提取的局部特征对应图片中的位置,将其划分到各层级对应的子区域中,然后从金字塔基层向上依次对各自子区域内的深度自编码特征费舍尔编码,依次串联,再次PCA降维和标准化,得到空间金字塔费舍尔特征。步骤五:将步骤四中得到表示费舍尔特征的图片,通过改变图片对应图像块的组成间接生成新数据,扩充场景数据集;步骤六:采用深度网络对空间金字塔费舍尔特征分类,该深度判别网络包括全连接层和输出层,将步骤五得到的空间金字塔费舍尔编码作为第一层全连接层输入。
地址 210044 江苏省南京市浦口区宁六路219号