主权项 |
一种基于深度哈希的医学图像分布式检索方法,其特征在于,所述分布式检索方法包括深度哈希提取图像特征和基于Hadoop批量图像特征匹配并行化计算;其中,所述深度哈希提取图像特征包括以下步骤:S11、设计一个卷积神经网络模型,该模型包括顺序设置的第一卷积层、第一采样层、第二卷积层、第二采样层、第三卷积层、第三采样层、第一全连接层和第二全连接层;S12、以相似或者不相似图像对作为训练输入,经过所述卷积神经网络模型对图像进行多次卷积层,下采样层,全连接层传输,得到整体代价函数如下:<img file="FDA0001118680840000011.GIF" wi="1477" he="119" />其中,C是整体代价函数,N是图像对对数,y<sub>i</sub>是第i对图像是否相似,且0代表相似,1代表不相似,a<sub>i,1</sub>是第i对图像中第一个图像的输出结果,a<sub>i,2</sub>是第i对图像中第二个图像的输出结果,且a=σ(z),z=wx+b,σ为ReLU激活函数,w为权值矩阵,x为模型外部输入值即图像像素值,b为调整参数,θ为阈值;S13、根据整体代价函数按极小化误差的方法反向传播调整权值矩阵,直到损失函数值变化量小于很小的阈值或者达到指定的迭代次数,训练则终止,具体为将式(1)看作前后两个部分seg1和seg2,权值变化量为:<img file="FDA0001118680840000012.GIF" wi="1501" he="134" /><img file="FDA0001118680840000013.GIF" wi="1510" he="151" />因此,w的更新式子为:<img file="FDA0001118680840000021.GIF" wi="876" he="119" />其中,η为学习率,<img file="FDA0001118680840000022.GIF" wi="326" he="119" />S14、将图像库中的每个图像输入到训练好的步骤S11所设计的卷积神经网络模型中,将输出结果作为图像特征,并将输出的向量二值化作为哈希编码;所述基于Hadoop批量图像特征匹配并行化计算包括以下步骤:S21、将需要检索的批量图像输入到训练好的步骤S11所设计的卷积神经网络模型中,得到图像特征文件并上传到Hadoop中,Hadoop会对图像特征文件进行分块,并将分块分到不同的Mapper任务中,假设图像特征文件大小为fileSize MB,每个分块平均大小为splitSize MB,则有:<maths num="0001"><math><![CDATA[<mrow><mi>s</mi><mi>p</mi><mi>l</mi><mi>i</mi><mi>t</mi><mi>S</mi><mi>i</mi><mi>z</mi><mi>e</mi><mo>=</mo><mfrac><mrow><mi>f</mi><mi>i</mi><mi>l</mi><mi>e</mi><mi>S</mi><mi>i</mi><mi>z</mi><mi>e</mi></mrow><mi>n</mi></mfrac><mo>></mo><mn>128</mn><mo>?</mo><mn>128</mn><mo>:</mo><mfrac><mrow><mi>f</mi><mi>i</mi><mi>l</mi><mi>e</mi><mi>S</mi><mi>i</mi><mi>z</mi><mi>e</mi></mrow><mi>n</mi></mfrac></mrow>]]></math><img file="FDA0001118680840000023.GIF" wi="801" he="119" /></maths>其中,Hadoop2.X的默认块大小为128MB,n表示有n个Mapper任务;S22、每个Mapper的输入块中包含待检索图像的特征和哈希编码,首先根据哈希编码确定相似图像候选集,然后访问候选图像特征数据库,进行检索并计算与待检索图像特征向量的相似度大小,即计算两个特征向量的欧式距离;S23、将所有Mapper的输出结果合并到一个Reducer中,对每个待检索图像的集合,按照相似度大对检索的图像进行降序排序。 |