融合伪相关反馈与检索技术的自动图像标注方法,申请号CN200710118106.1-传众专利搜索

发明名称	融合伪相关反馈与检索技术的自动图像标注方法
摘要	本发明提供一种融合伪相关反馈与检索技术的自动图像标注方法，包含：步骤1：在已标注的图像库中对未标注的查询图像进行检索，得到k个相关图像及相关图像的关键词集合；步骤2：根据k个相关图像提取均值向量作为新的查询向量，步骤3：计算每个关键词，标注查询图像的后验概率；重复步骤1至3，直到预先设定的最大迭代次数N；步骤4：计算每个关键词，在每轮关键词集合中的稳定性因子；步骤5：根据后验概率及稳定性因子的值，计算每个关键词，标注查询图像的排序概率；步骤6：根据得到的每个关键词的排序概率进行排序，选择最后的关键词列表。本发明的优点在于：提高了检索性能及标注的准确性，极大地改善了标注的可伸缩性，是一个灵活可靠、有实用价值的标注方法。
申请公布号	CN100535906C	申请公布日期	2009.09.02
申请号	CN200710118106.1	申请日期	2007.06.28
申请人	北京交通大学	发明人	赵耀;赵玉凤;朱振峰
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	北京市商泰律师事务所	代理人	毛燕生
主权项	1、一种融合伪相关反馈与检索的自动图像标注方法，其特征在于，包含：步骤1：在已标注的图像库中对未标注的查询图像I<sub>q</sub>进行检索，得到k个相关图像I<sub>r</sub>及相关图像的关键词集合Ψ<sub>w</sub>；步骤2：根据k个相关图像提取均值向量I<sub>mean</sub>作为新的查询向量，重复步骤1，直到最大迭代次数N；步骤3：计算每个关键词W，w∈Ψ<sub>w</sub>标注查询图像I<sub>q</sub>的后验概率p(w\|I<sub>q</sub>)；后验概率p(w\|I<sub>q</sub>)由相关图像与查询图像之间的相似性度量p(w\|I<sub>r</sub>)来确定，即p(w\|I<sub>q</sub>)＝p(w\|I<sub>r</sub>)·p(I<sub>r</sub>\|I<sub>q</sub>)；其中p(I<sub>r</sub>\|I<sub>q</sub>)＝ω<sub>r</sub>·S(I<sub>r</sub>\|I<sub>q</sub>)；p(w\|I<sub>r</sub>)当关键词W标注相关图像I<sub>r</sub>时为1，否则为0；S(I<sub>r</sub>\|I<sub>q</sub>)＝exp(-D(I<sub>r</sub>，I<sub>q</sub>))，<maths num="0001"><![CDATA[<math><mrow><msub><mi>ω</mi><mi>r</mi></msub><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mfrac><mrow><mo>-</mo><mi>D</mi><msup><mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>r</mi></msub><mo>,</mo><msub><mi>I</mi><mi>mean</mi></msub><mo>)</mo></mrow></mrow><mn>2</mn></msup></mrow><mrow><mn>2</mn><msup><mi>σ</mi><mn>2</mn></msup></mrow></mfrac><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>D(I<sub>r</sub>，I<sub>q</sub>)为查询图像与相关图像之间的欧式距离度量；D(I<sub>r</sub>，I<sub>mean</sub>)为相关图像与提取的均值向量之间的欧式距离度量；σ为相关图像与提取的均值向量之间纬度上的标准差；重复步骤1至3，直到预先设定的最大迭代次数N；步骤4：计算每个关键词W，<maths num="0002"><![CDATA[<math><mrow><mi>w</mi><mo>&Element;</mo><munderover><mo>∪</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>Ψ</mi><mi>w</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths>在每轮关键词集合中的稳定性因子λ<sub>i</sub>(w)，i＝1，2，...，N；步骤5：根据后验概率p(w\|I<sub>q</sub>)及稳定性因子λ<sub>i</sub>(w)，i＝1，2，...，N的值，计算每个关键词w，<maths num="0003"><![CDATA[<math><mrow><mi>w</mi><mo>&Element;</mo><munderover><mo>∪</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>Ψ</mi><mi>w</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths>标注查询图像I<sub>q</sub>的排序概率f(w)，<maths num="0004"><![CDATA[<math><mrow><mi>f</mi><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>λ</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><mo>·</mo><msub><mi>p</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>w</mi><mo>\|</mo><msub><mi>I</mi><mi>q</mi></msub><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>将第i次检索中后验概率及稳定性因子乘积，在1≤i≤N对上述乘积求和，从而衡量出每个关键词标注查询图像的排序概率，用于实现融合伪相关反馈与检索的自动图像标注，对查询图像I<sub>q</sub>进行标注；步骤6：根据得到的每个关键词w的排序概率进行排序，选择最后的关键词列表。
地址	100044北京市西直门外上园村3号