发明名称 基于径向基函数神经网络的多样化图像标注和检索方法
摘要 本发明公开了一种基于RBFNN的多样化图像标注和检索方法,包括:(1)构建和学RBFNN模型,构建出能覆盖图像“子概念”的RBFNN模型;(2)将检索资料库预处理后的数据输入步骤(1)构建的RBFNN模型中,对图像库中图片进行多样化标注,同时给图像库中图片标注“概念”和“子概念”标签;(3)根据检索关键词和步骤(2)的标注结果,对标注后的图像库进行多样化检索:首先查找所有标注检索关键词的图片,并根据“概念”相似度进行排序;然后,将分属不同“子概念”的图片按照“概念”相似度由高到低的顺序置前;(4)输出检索结果。本发明的优点在于:提高了图像检索精度,同时大大提高了图像检索结果多样性,节约了检索时间,具有较高的鲁棒性和实用性。
申请公布号 CN102999615B 申请公布日期 2016.04.27
申请号 CN201210499091.9 申请日期 2012.11.29
申请人 合肥工业大学 发明人 赵仲秋;季海峰;谢宝剑;黄德双;吴信东
分类号 G06F17/30(2006.01)I;G06N3/08(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 安徽汇朴律师事务所 34116 代理人 丁瑞瑞
主权项 一种基于径向基函数神经网络的多样化图像标注和检索方法,其特征在于:包括以下步骤:(1)构建和学习RBFNN模型,构建出能够覆盖图像“子概念”的RBFNN模型;(2)根据步骤(1)构建的RBFNN模型,将检索资料库预处理后的数据输入到RBFNN模型中,对图像库中图片进行多样化标注,同时给图像库中图片标注“概念”和“子概念”标签;(3)根据检索关键词和步骤(2)的标注结果,对标注后的图像库进行多样化检索:首先查找所有标注检索关键词的图片,并根据“概念”相似度进行排序;然后,将分属不同“子概念”的图片按照“概念”相似度由高到低的顺序置前;(4)输出检索结果;所述步骤(1)具体包括:首先输入训练图像样本,并对图像进行预处理,并提取特征,然后基于这些训练图像样本,采用如下步骤学习RBFNN模型:1)基于检索相关性和多样性目标的RBF网络结构优化:首先对训练图像样本聚类,得到N<sub>c</sub>个聚类中心作为RBFNN初始化的候选隐中心,结合粒子群优化PSO算法来对RBF网络结构中的随机选取的隐中心位置、数目以及宽度参数进行并行优化,采用离散和连续混合编码形式,其中离散部分是对隐中心位置和数目的二进制编码,长度为候选隐中心的个数,基因值为“1”表示对应的候选隐中心被选中,否则表示未被选中;而连续部分是对宽度参数的编码;所述基于检索相关性和多样性目标的RBF网络结构优化的具体步骤如下:①适应度函数的设计使用代价学习误差CE作为适应度函数的自变量,使正类以及正类中“非占优”“子概念”内的样本误差代价增大,而其它样本误差代价减小,CE表示为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>&beta;</mi><mi>i</mi></msub><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>-</mo><msub><mi>y</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000021.GIF" wi="774" he="142" /></maths>式中β<sub>i</sub>是各样本的误差代价,t<sub>ij</sub>,y<sub>ij</sub>分别表示输入第i个样本时,网络第j个输出节点的期望输出值和实际输出值,N表示样本总数,此外,采用“M交叉认证”M‑FOLD‑CV对网络的泛化能力进行表达,并定义一种“M交叉认证”代价误差为<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow><mrow><mi>M</mi><mo>-</mo><mi>F</mi><mi>O</mi><mi>L</mi><mi>D</mi><mo>-</mo><mi>C</mi><mi>V</mi></mrow></msubsup><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>m</mi></msub></munderover><msubsup><mi>&beta;</mi><mi>i</mi><mi>m</mi></msubsup><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msup><mrow><mo>(</mo><msubsup><mi>t</mi><mrow><mi>i</mi><mi>j</mi></mrow><mi>m</mi></msubsup><mo>-</mo><msubsup><mi>y</mi><mrow><mi>i</mi><mi>j</mi></mrow><mrow><mo>(</mo><mo>-</mo><msub><mi>S</mi><mi>m</mi></msub><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000022.GIF" wi="1350" he="269" /></maths>公式中<img file="FDA0000831337450000023.GIF" wi="124" he="84" />表示排除第m个子集S<sub>m</sub>,由剩余M‑1个子集学习RBFNN分类器连接权值后输入子集S<sub>m</sub>中第i个样本时,网络第j个输出节点的输出值,综上,根据优化目标,设计适应度函数为<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>f</mi><mi>i</mi><mi>t</mi><mi>n</mi><mi>e</mi><mi>s</mi><mi>s</mi><mo>=</mo><mi>f</mi><mrow><mo>(</mo><msubsup><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow><mrow><mi>M</mi><mo>-</mo><mi>F</mi><mi>O</mi><mi>L</mi><mi>D</mi><mo>-</mo><mi>C</mi><mi>V</mi></mrow></msubsup><mo>)</mo></mrow><mo>=</mo><mo>-</mo><msubsup><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow><mrow><mi>M</mi><mo>-</mo><mi>F</mi><mi>O</mi><mi>L</mi><mi>D</mi><mo>-</mo><mi>C</mi><mi>V</mi></mrow></msubsup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000024.GIF" wi="1365" he="206" /></maths>其中,各样本的误差代价β<sub>i</sub>根据样本分布情况定义;②RBF网络连接权值的学习网络的代价误差是网络连接权值矩阵W的函数,公式(1)可表示为以下形式:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow></msub><mrow><mo>(</mo><mi>W</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>&beta;</mi><mi>i</mi></msub><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>-</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><msub><mi>&phi;</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><msub><mi>w</mi><mrow><mi>k</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>=</mo><mo>|</mo><mo>|</mo><msup><mi>B</mi><mrow><mn>1</mn><mo>/</mo><mn>2</mn></mrow></msup><mrow><mo>(</mo><mi>T</mi><mo>-</mo><mi>&Phi;</mi><mi>W</mi><mo>)</mo></mrow><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000031.GIF" wi="1534" he="270" /></maths>其中t<sub>ij</sub>表示输入第i个样本时,网络第j个输出节点的期望输出值,φ<sub>ik</sub>表示网络输入第i个样本时第k个隐节点的响应输出,w<sub>kj</sub>是网络第k个隐节点到第j个输出节点间的连接权值,T是矩阵(t<sub>ij</sub>),Φ是矩阵(φ<sub>ik</sub>),Β是对角阵<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mi>B</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>&beta;</mi><mn>1</mn></msub></mtd><mtd><mn>0</mn></mtd><mtd><mo>...</mo></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><msub><mi>&beta;</mi><mn>2</mn></msub></mtd><mtd><mo>...</mo></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mo>...</mo></mtd><mtd><mo>...</mo></mtd><mtd><mo>...</mo></mtd><mtd><mo>...</mo></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>...</mo></mtd><mtd><mn>0</mn></mtd><mtd><msub><mi>&beta;</mi><mi>N</mi></msub></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000032.GIF" wi="1117" he="414" /></maths>按函数求解极值法,求E<sub>cost</sub>(W)对W的偏导数,且令其为0,可得到(Φ<sup>T</sup>ΒΦ)W<sup>T</sup>=Φ<sup>T</sup>ΒT,解得W<sup>T</sup>=(Φ<sup>T</sup>ΒΦ)<sup>‑1</sup>Φ<sup>T</sup>ΒT          (6)。
地址 230009 安徽省合肥市屯溪路193号