一种基于深度哈希的医学图像分布式检索方法,申请号CN201610844011.7-传众专利搜索

发明名称	一种基于深度哈希的医学图像分布式检索方法
摘要	本发明提供一种基于深度哈希的医学图像分布式检索方法，包括深度哈希提取图像特征和基于Hadoop批量图像特征匹配并行化计算，深度哈希提取图像特征是通过卷积神经网络模型，以相似或者不相似图像对作为训练输入，利用反向传播算法计算目标函数相对多层网络权值的梯度，最终引导每张图像多个输出值近似离散的0或者1，基于Hadoop批量图像特征匹配并行化计算是将批量图像的特征文件分成多个块，块与块之间是相互独立的，这些块通过Apache Hadoop YARN资源管理器，分配到不同节点上执行，最后所有Mapper执行完后的结果全部合并到一个Reducer中。本发明中的方法可以减少图像表示与语义之间的鸿沟，提高检索精确度，且通过并行化特征匹配加速检索过程，增强了批量医学图像检索效率。
申请公布号	CN106383891A	申请公布日期	2017.02.08
申请号	CN201610844011.7	申请日期	2016.09.22
申请人	重庆理工大学	发明人	崔少国;毛雷;熊舒羽
分类号	G06F17/30(2006.01)I;G06N3/08(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	重庆信航知识产权代理有限公司 50218	代理人	穆祥维
主权项	一种基于深度哈希的医学图像分布式检索方法，其特征在于，所述分布式检索方法包括深度哈希提取图像特征和基于Hadoop批量图像特征匹配并行化计算；其中，所述深度哈希提取图像特征包括以下步骤：S11、设计一个卷积神经网络模型，该模型包括顺序设置的第一卷积层、第一采样层、第二卷积层、第二采样层、第三卷积层、第三采样层、第一全连接层和第二全连接层；S12、以相似或者不相似图像对作为训练输入，经过所述卷积神经网络模型对图像进行多次卷积层，下采样层，全连接层传输，得到整体代价函数如下：<img file="FDA0001118680840000011.GIF" wi="1477" he="119" />其中，C是整体代价函数，N是图像对对数，y<sub>i</sub>是第i对图像是否相似，且0代表相似，1代表不相似，a<sub>i,1</sub>是第i对图像中第一个图像的输出结果，a<sub>i,2</sub>是第i对图像中第二个图像的输出结果，且a＝σ(z),z＝wx+b，σ为ReLU激活函数，w为权值矩阵，x为模型外部输入值即图像像素值，b为调整参数，θ为阈值；S13、根据整体代价函数按极小化误差的方法反向传播调整权值矩阵，直到损失函数值变化量小于很小的阈值或者达到指定的迭代次数，训练则终止，具体为将式(1)看作前后两个部分seg1和seg2，权值变化量为：<img file="FDA0001118680840000012.GIF" wi="1501" he="134" /><img file="FDA0001118680840000013.GIF" wi="1510" he="151" />因此，w的更新式子为：<img file="FDA0001118680840000021.GIF" wi="876" he="119" />其中，η为学习率，<img file="FDA0001118680840000022.GIF" wi="326" he="119" />S14、将图像库中的每个图像输入到训练好的步骤S11所设计的卷积神经网络模型中，将输出结果作为图像特征，并将输出的向量二值化作为哈希编码；所述基于Hadoop批量图像特征匹配并行化计算包括以下步骤：S21、将需要检索的批量图像输入到训练好的步骤S11所设计的卷积神经网络模型中，得到图像特征文件并上传到Hadoop中，Hadoop会对图像特征文件进行分块，并将分块分到不同的Mapper任务中，假设图像特征文件大小为fileSize MB，每个分块平均大小为splitSize MB，则有：<maths num="0001"><math><![CDATA[<mrow><mi>s</mi><mi>p</mi><mi>l</mi><mi>i</mi><mi>t</mi><mi>S</mi><mi>i</mi><mi>z</mi><mi>e</mi><mo>=</mo><mfrac><mrow><mi>f</mi><mi>i</mi><mi>l</mi><mi>e</mi><mi>S</mi><mi>i</mi><mi>z</mi><mi>e</mi></mrow><mi>n</mi></mfrac><mo>></mo><mn>128</mn><mo>?</mo><mn>128</mn><mo>:</mo><mfrac><mrow><mi>f</mi><mi>i</mi><mi>l</mi><mi>e</mi><mi>S</mi><mi>i</mi><mi>z</mi><mi>e</mi></mrow><mi>n</mi></mfrac></mrow>]]></math><img file="FDA0001118680840000023.GIF" wi="801" he="119" /></maths>其中，Hadoop2.X的默认块大小为128MB，n表示有n个Mapper任务；S22、每个Mapper的输入块中包含待检索图像的特征和哈希编码，首先根据哈希编码确定相似图像候选集，然后访问候选图像特征数据库，进行检索并计算与待检索图像特征向量的相似度大小，即计算两个特征向量的欧式距离；S23、将所有Mapper的输出结果合并到一个Reducer中，对每个待检索图像的集合，按照相似度大对检索的图像进行降序排序。
地址	400054 重庆市巴南区李家沱红光大道69号