发明名称 一种基于深度哈希的医学图像分布式检索方法
摘要 本发明提供一种基于深度哈希的医学图像分布式检索方法,包括深度哈希提取图像特征和基于Hadoop批量图像特征匹配并行化计算,深度哈希提取图像特征是通过卷积神经网络模型,以相似或者不相似图像对作为训练输入,利用反向传播算法计算目标函数相对多层网络权值的梯度,最终引导每张图像多个输出值近似离散的0或者1,基于Hadoop批量图像特征匹配并行化计算是将批量图像的特征文件分成多个块,块与块之间是相互独立的,这些块通过Apache Hadoop YARN资源管理器,分配到不同节点上执行,最后所有Mapper执行完后的结果全部合并到一个Reducer中。本发明中的方法可以减少图像表示与语义之间的鸿沟,提高检索精确度,且通过并行化特征匹配加速检索过程,增强了批量医学图像检索效率。
申请公布号 CN106383891A 申请公布日期 2017.02.08
申请号 CN201610844011.7 申请日期 2016.09.22
申请人 重庆理工大学 发明人 崔少国;毛雷;熊舒羽
分类号 G06F17/30(2006.01)I;G06N3/08(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 重庆信航知识产权代理有限公司 50218 代理人 穆祥维
主权项 一种基于深度哈希的医学图像分布式检索方法,其特征在于,所述分布式检索方法包括深度哈希提取图像特征和基于Hadoop批量图像特征匹配并行化计算;其中,所述深度哈希提取图像特征包括以下步骤:S11、设计一个卷积神经网络模型,该模型包括顺序设置的第一卷积层、第一采样层、第二卷积层、第二采样层、第三卷积层、第三采样层、第一全连接层和第二全连接层;S12、以相似或者不相似图像对作为训练输入,经过所述卷积神经网络模型对图像进行多次卷积层,下采样层,全连接层传输,得到整体代价函数如下:<img file="FDA0001118680840000011.GIF" wi="1477" he="119" />其中,C是整体代价函数,N是图像对对数,y<sub>i</sub>是第i对图像是否相似,且0代表相似,1代表不相似,a<sub>i,1</sub>是第i对图像中第一个图像的输出结果,a<sub>i,2</sub>是第i对图像中第二个图像的输出结果,且a=σ(z),z=wx+b,σ为ReLU激活函数,w为权值矩阵,x为模型外部输入值即图像像素值,b为调整参数,θ为阈值;S13、根据整体代价函数按极小化误差的方法反向传播调整权值矩阵,直到损失函数值变化量小于很小的阈值或者达到指定的迭代次数,训练则终止,具体为将式(1)看作前后两个部分seg1和seg2,权值变化量为:<img file="FDA0001118680840000012.GIF" wi="1501" he="134" /><img file="FDA0001118680840000013.GIF" wi="1510" he="151" />因此,w的更新式子为:<img file="FDA0001118680840000021.GIF" wi="876" he="119" />其中,η为学习率,<img file="FDA0001118680840000022.GIF" wi="326" he="119" />S14、将图像库中的每个图像输入到训练好的步骤S11所设计的卷积神经网络模型中,将输出结果作为图像特征,并将输出的向量二值化作为哈希编码;所述基于Hadoop批量图像特征匹配并行化计算包括以下步骤:S21、将需要检索的批量图像输入到训练好的步骤S11所设计的卷积神经网络模型中,得到图像特征文件并上传到Hadoop中,Hadoop会对图像特征文件进行分块,并将分块分到不同的Mapper任务中,假设图像特征文件大小为fileSize MB,每个分块平均大小为splitSize MB,则有:<maths num="0001"><math><![CDATA[<mrow><mi>s</mi><mi>p</mi><mi>l</mi><mi>i</mi><mi>t</mi><mi>S</mi><mi>i</mi><mi>z</mi><mi>e</mi><mo>=</mo><mfrac><mrow><mi>f</mi><mi>i</mi><mi>l</mi><mi>e</mi><mi>S</mi><mi>i</mi><mi>z</mi><mi>e</mi></mrow><mi>n</mi></mfrac><mo>&gt;</mo><mn>128</mn><mo>?</mo><mn>128</mn><mo>:</mo><mfrac><mrow><mi>f</mi><mi>i</mi><mi>l</mi><mi>e</mi><mi>S</mi><mi>i</mi><mi>z</mi><mi>e</mi></mrow><mi>n</mi></mfrac></mrow>]]></math><img file="FDA0001118680840000023.GIF" wi="801" he="119" /></maths>其中,Hadoop2.X的默认块大小为128MB,n表示有n个Mapper任务;S22、每个Mapper的输入块中包含待检索图像的特征和哈希编码,首先根据哈希编码确定相似图像候选集,然后访问候选图像特征数据库,进行检索并计算与待检索图像特征向量的相似度大小,即计算两个特征向量的欧式距离;S23、将所有Mapper的输出结果合并到一个Reducer中,对每个待检索图像的集合,按照相似度大对检索的图像进行降序排序。
地址 400054 重庆市巴南区李家沱红光大道69号