发明名称 一种基于深度卷积神经网络的三维网格语义标记方法
摘要 本发明提供一种基于深度卷积神经网络的三维网格语义标记方法,该方法包括五大步骤:步骤一:三维网格三角面片的特征向量构建;步骤二:深度卷积神经网络构建;步骤三:根据已有的带语义标记三维网格数据进行深度卷积神经网络训练;步骤四:根据输入的无语义标记三维网络数据进行语义标记概率计算;步骤五:根据三维网格三角面片间的二面角进行语义标记结果优化。本发明基于训练的深度卷积神经网络,三维网格语义标记准确率高。
申请公布号 CN104103093B 申请公布日期 2017.02.15
申请号 CN201410327036.0 申请日期 2014.07.10
申请人 北京航空航天大学 发明人 陈小武;郭侃;邹冬青;赵沁平
分类号 G06T17/10(2006.01)I 主分类号 G06T17/10(2006.01)I
代理机构 北京慧泉知识产权代理有限公司 11232 代理人 王顺荣;唐爱华
主权项 一种基于深度卷积神经网络的三维网格语义标记方法,其特征在于,它包括以下步骤:步骤一:三维网格三角面片的特征向量构建;其具体实现过程如下:(1)计算三角面片的Curvature feature即CUR;(2)计算三角面片的PCA feature即PCA;(3)计算三角面片的Shape Diameter Function即SDF;(4)计算三角面片的Distance from medial surface即DIS;(5)计算三角面片的Average Geodesic Distance即AGD;(6)计算三角面片的Shape Context即SC;(7)计算三角面片的Spin Image即SI;步骤二:深度卷积神经网络构建;其具体实现过程如下:(1)构建尺寸为7*5、输出层数为12的卷积层;(2)构建缩放因子为2的下采样层;(3)构建尺寸为5*5、输出层数为24的卷积层;(4)构建缩放因子为2的下采样层;步骤三:根据已有的带语义标记三维网格数据进行深度卷积神经网络训练;其具体实现过程如下:(1)根据步骤一计算已有的带语义标记三维网格数据的三角面片特征;(2)前向传导:将上述计算得到的三角面片特征输入到步骤二构建的深度卷积神经网络中,逐层计算,得到每个面片属于各个语义标记的概率;(3)由上述计算得到的概率与已有的语义标记数据相减并做平方运算得到残差;(4)反向传播:根据计算得到的残差从最后一层往前逐层对每一层的参数求偏导,并逐层更新每层的参数值;(5)迭代过程(2)‑(4)直到残差收敛;步骤四:根据输入的无语义标记三维网络数据进行语义标记概率计算;其具体实现过程如下:(1)根据步骤一计算无语义标记三维网络数的三角面片特征;(2)将上述计算得到的三角面片特征输入到步骤三训练得到的深度卷积神经网络中,逐层计算,得到每个面片属于各个语义标记的概率;步骤五:根据三维网格相邻三角面片间的二面角进行语义标记结果优化;其具体实现过程如下:(1)计算三维网络相邻三角面片间的二面角;(2)根据步骤四计算得到的语义标记概率与过程(1)计算得到的二面角,构建图结构,应用Graphcuts算法进行结果优化;其中,由CUR、PCA、SDF、DIS、AGD、SC及SI,构成600维的特征向量,再重构成30*20的矩阵记作X,以便作为深度网络的输入;第一阶段为包含12个尺寸为7*5的卷积核的卷积层;令W<sub>i</sub>为一个卷积核的权重,定义卷积操作如下:Y<sub>i</sub>=W<sub>i</sub>*X+b<sub>i</sub>,i=1...12其中*表示卷积操作,b<sub>i</sub>表示偏置向量;利用12个卷积核对输入的基本几何特征进行卷积操作,得到12个尺寸为24*16的输出特征,紧接着利用sigmoid激活函数对其进行激活操作如下:<maths num="0001"><math><![CDATA[<mrow><mi>M</mi><mo>=</mo><mi>s</mi><mi>i</mi><mi>g</mi><mi>m</mi><mi>o</mi><mi>i</mi><mi>d</mi><mrow><mo>(</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><msup><mi>exp</mi><mrow><mo>-</mo><mi>Y</mi></mrow></msup></mrow></mfrac></mrow>]]></math><img file="FDA0001049086530000021.GIF" wi="572" he="127" /></maths>然后对经过非线性与激活操作后的特征进行缩放因子为2的下采样操作,得到12个尺寸为12*8的输出特征作为第二阶段的输入;在第二阶段,将第一阶段输出的12个输出特征扩展为24个尺寸为8*4的新特征;对于每一个新特征的求解,利用12个尺寸为5*5的卷积核构建的卷积层对第一阶段的12个输出特征进行卷积操作并进行叠加操作;对得到的特征进行激活操作与下采样操作,最后得到24个尺寸为4*2的输出特征;在第三阶段,将第二阶段输出的特征重构为192*1的特征向量,为了将输出特征归一化到[0,1]之间,利用非线性映射并再次应用sigmoid激活函数对其进行激活操作,并得到每个三角面片t属于不同语义标记的概率值P<sub>t</sub>。
地址 100191 北京市海淀区学院路37号