基于径向基函数神经网络的多样化图像标注和检索方法,申请号CN201210499091.9-传众专利搜索

发明名称	基于径向基函数神经网络的多样化图像标注和检索方法
摘要	本发明公开了一种基于RBFNN的多样化图像标注和检索方法，包括：（1）构建和学RBFNN模型，构建出能覆盖图像“子概念”的RBFNN模型；（2）将检索资料库预处理后的数据输入步骤（1）构建的RBFNN模型中，对图像库中图片进行多样化标注，同时给图像库中图片标注“概念”和“子概念”标签；（3）根据检索关键词和步骤（2）的标注结果，对标注后的图像库进行多样化检索：首先查找所有标注检索关键词的图片，并根据“概念”相似度进行排序；然后，将分属不同“子概念”的图片按照“概念”相似度由高到低的顺序置前；（4）输出检索结果。本发明的优点在于：提高了图像检索精度，同时大大提高了图像检索结果多样性，节约了检索时间，具有较高的鲁棒性和实用性。
申请公布号	CN102999615B	申请公布日期	2016.04.27
申请号	CN201210499091.9	申请日期	2012.11.29
申请人	合肥工业大学	发明人	赵仲秋;季海峰;谢宝剑;黄德双;吴信东
分类号	G06F17/30(2006.01)I;G06N3/08(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	安徽汇朴律师事务所 34116	代理人	丁瑞瑞
主权项	一种基于径向基函数神经网络的多样化图像标注和检索方法，其特征在于：包括以下步骤：(1)构建和学习RBFNN模型，构建出能够覆盖图像“子概念”的RBFNN模型；(2)根据步骤(1)构建的RBFNN模型，将检索资料库预处理后的数据输入到RBFNN模型中，对图像库中图片进行多样化标注，同时给图像库中图片标注“概念”和“子概念”标签；(3)根据检索关键词和步骤(2)的标注结果，对标注后的图像库进行多样化检索：首先查找所有标注检索关键词的图片，并根据“概念”相似度进行排序；然后，将分属不同“子概念”的图片按照“概念”相似度由高到低的顺序置前；(4)输出检索结果；所述步骤(1)具体包括：首先输入训练图像样本，并对图像进行预处理，并提取特征，然后基于这些训练图像样本，采用如下步骤学习RBFNN模型：1)基于检索相关性和多样性目标的RBF网络结构优化：首先对训练图像样本聚类，得到N<sub>c</sub>个聚类中心作为RBFNN初始化的候选隐中心，结合粒子群优化PSO算法来对RBF网络结构中的随机选取的隐中心位置、数目以及宽度参数进行并行优化，采用离散和连续混合编码形式，其中离散部分是对隐中心位置和数目的二进制编码，长度为候选隐中心的个数，基因值为“1”表示对应的候选隐中心被选中，否则表示未被选中；而连续部分是对宽度参数的编码；所述基于检索相关性和多样性目标的RBF网络结构优化的具体步骤如下：①适应度函数的设计使用代价学习误差CE作为适应度函数的自变量，使正类以及正类中“非占优”“子概念”内的样本误差代价增大，而其它样本误差代价减小，CE表示为：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow></msub><mo>=</mo><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>β</mi><mi>i</mi></msub><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>-</mo><msub><mi>y</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000021.GIF" wi="774" he="142" /></maths>式中β<sub>i</sub>是各样本的误差代价，t<sub>ij</sub>，y<sub>ij</sub>分别表示输入第i个样本时，网络第j个输出节点的期望输出值和实际输出值，N表示样本总数，此外，采用“M交叉认证”M‑FOLD‑CV对网络的泛化能力进行表达，并定义一种“M交叉认证”代价误差为<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow><mrow><mi>M</mi><mo>-</mo><mi>F</mi><mi>O</mi><mi>L</mi><mi>D</mi><mo>-</mo><mi>C</mi><mi>V</mi></mrow></msubsup><mo>=</mo><munderover><mo>Σ</mo><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>m</mi></msub></munderover><msubsup><mi>β</mi><mi>i</mi><mi>m</mi></msubsup><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msup><mrow><mo>(</mo><msubsup><mi>t</mi><mrow><mi>i</mi><mi>j</mi></mrow><mi>m</mi></msubsup><mo>-</mo><msubsup><mi>y</mi><mrow><mi>i</mi><mi>j</mi></mrow><mrow><mo>(</mo><mo>-</mo><msub><mi>S</mi><mi>m</mi></msub><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000022.GIF" wi="1350" he="269" /></maths>公式中<img file="FDA0000831337450000023.GIF" wi="124" he="84" />表示排除第m个子集S<sub>m</sub>，由剩余M‑1个子集学习RBFNN分类器连接权值后输入子集S<sub>m</sub>中第i个样本时，网络第j个输出节点的输出值，综上，根据优化目标，设计适应度函数为<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>f</mi><mi>i</mi><mi>t</mi><mi>n</mi><mi>e</mi><mi>s</mi><mi>s</mi><mo>=</mo><mi>f</mi><mrow><mo>(</mo><msubsup><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow><mrow><mi>M</mi><mo>-</mo><mi>F</mi><mi>O</mi><mi>L</mi><mi>D</mi><mo>-</mo><mi>C</mi><mi>V</mi></mrow></msubsup><mo>)</mo></mrow><mo>=</mo><mo>-</mo><msubsup><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow><mrow><mi>M</mi><mo>-</mo><mi>F</mi><mi>O</mi><mi>L</mi><mi>D</mi><mo>-</mo><mi>C</mi><mi>V</mi></mrow></msubsup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000024.GIF" wi="1365" he="206" /></maths>其中，各样本的误差代价β<sub>i</sub>根据样本分布情况定义；②RBF网络连接权值的学习网络的代价误差是网络连接权值矩阵W的函数，公式(1)可表示为以下形式：<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>E</mi><mrow><mi>cos</mi><mi>t</mi></mrow></msub><mrow><mo>(</mo><mi>W</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>β</mi><mi>i</mi></msub><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>-</mo><munderover><mo>Σ</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><msub><mi>φ</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><msub><mi>w</mi><mrow><mi>k</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>=</mo><mo>\|</mo><mo>\|</mo><msup><mi>B</mi><mrow><mn>1</mn><mo>/</mo><mn>2</mn></mrow></msup><mrow><mo>(</mo><mi>T</mi><mo>-</mo><mi>Φ</mi><mi>W</mi><mo>)</mo></mrow><mo>\|</mo><msup><mo>\|</mo><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000031.GIF" wi="1534" he="270" /></maths>其中t<sub>ij</sub>表示输入第i个样本时，网络第j个输出节点的期望输出值，φ<sub>ik</sub>表示网络输入第i个样本时第k个隐节点的响应输出，w<sub>kj</sub>是网络第k个隐节点到第j个输出节点间的连接权值，T是矩阵(t<sub>ij</sub>)，Φ是矩阵(φ<sub>ik</sub>)，Β是对角阵<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mi>B</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>β</mi><mn>1</mn></msub></mtd><mtd><mn>0</mn></mtd><mtd><mo>...</mo></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><msub><mi>β</mi><mn>2</mn></msub></mtd><mtd><mo>...</mo></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mo>...</mo></mtd><mtd><mo>...</mo></mtd><mtd><mo>...</mo></mtd><mtd><mo>...</mo></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>...</mo></mtd><mtd><mn>0</mn></mtd><mtd><msub><mi>β</mi><mi>N</mi></msub></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000831337450000032.GIF" wi="1117" he="414" /></maths>按函数求解极值法，求E<sub>cost</sub>(W)对W的偏导数，且令其为0，可得到(Φ<sup>T</sup>ΒΦ)W<sup>T</sup>＝Φ<sup>T</sup>ΒT，解得W<sup>T</sup>＝(Φ<sup>T</sup>ΒΦ)<sup>‑1</sup>Φ<sup>T</sup>ΒT (6)。
地址	230009 安徽省合肥市屯溪路193号