发明名称 融合伪相关反馈与检索技术的自动图像标注方法
摘要 本发明提供一种融合伪相关反馈与检索技术的自动图像标注方法,包含:步骤1:在已标注的图像库中对未标注的查询图像进行检索,得到k个相关图像及相关图像的关键词集合;步骤2:根据k个相关图像提取均值向量作为新的查询向量,步骤3:计算每个关键词,标注查询图像的后验概率;重复步骤1至3,直到预先设定的最大迭代次数N;步骤4:计算每个关键词,在每轮关键词集合中的稳定性因子;步骤5:根据后验概率及稳定性因子的值,计算每个关键词,标注查询图像的排序概率;步骤6:根据得到的每个关键词的排序概率进行排序,选择最后的关键词列表。本发明的优点在于:提高了检索性能及标注的准确性,极大地改善了标注的可伸缩性,是一个灵活可靠、有实用价值的标注方法。
申请公布号 CN100535906C 申请公布日期 2009.09.02
申请号 CN200710118106.1 申请日期 2007.06.28
申请人 北京交通大学 发明人 赵耀;赵玉凤;朱振峰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市商泰律师事务所 代理人 毛燕生
主权项 1、一种融合伪相关反馈与检索的自动图像标注方法,其特征在于,包含:步骤1:在已标注的图像库中对未标注的查询图像I<sub>q</sub>进行检索,得到k个相关图像I<sub>r</sub>及相关图像的关键词集合Ψ<sub>w</sub>;步骤2:根据k个相关图像提取均值向量I<sub>mean</sub>作为新的查询向量,重复步骤1,直到最大迭代次数N;步骤3:计算每个关键词W,w∈Ψ<sub>w</sub>标注查询图像I<sub>q</sub>的后验概率p(w|I<sub>q</sub>);后验概率p(w|I<sub>q</sub>)由相关图像与查询图像之间的相似性度量p(w|I<sub>r</sub>)来确定,即p(w|I<sub>q</sub>)=p(w|I<sub>r</sub>)·p(I<sub>r</sub>|I<sub>q</sub>);其中p(I<sub>r</sub>|I<sub>q</sub>)=ω<sub>r</sub>·S(I<sub>r</sub>|I<sub>q</sub>);p(w|I<sub>r</sub>)当关键词W标注相关图像I<sub>r</sub>时为1,否则为0;S(I<sub>r</sub>|I<sub>q</sub>)=exp(-D(I<sub>r</sub>,I<sub>q</sub>)),<maths num="0001"><![CDATA[<math><mrow><msub><mi>&omega;</mi><mi>r</mi></msub><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mfrac><mrow><mo>-</mo><mi>D</mi><msup><mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>r</mi></msub><mo>,</mo><msub><mi>I</mi><mi>mean</mi></msub><mo>)</mo></mrow></mrow><mn>2</mn></msup></mrow><mrow><mn>2</mn><msup><mi>&sigma;</mi><mn>2</mn></msup></mrow></mfrac><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>D(I<sub>r</sub>,I<sub>q</sub>)为查询图像与相关图像之间的欧式距离度量;D(I<sub>r</sub>,I<sub>mean</sub>)为相关图像与提取的均值向量之间的欧式距离度量;σ为相关图像与提取的均值向量之间纬度上的标准差;重复步骤1至3,直到预先设定的最大迭代次数N;步骤4:计算每个关键词W,<maths num="0002"><![CDATA[<math><mrow><mi>w</mi><mo>&Element;</mo><munderover><mo>&cup;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>&Psi;</mi><mi>w</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths>在每轮关键词集合中的稳定性因子λ<sub>i</sub>(w),i=1,2,...,N;步骤5:根据后验概率p(w|I<sub>q</sub>)及稳定性因子λ<sub>i</sub>(w),i=1,2,...,N的值,计算每个关键词w,<maths num="0003"><![CDATA[<math><mrow><mi>w</mi><mo>&Element;</mo><munderover><mo>&cup;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>&Psi;</mi><mi>w</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths>标注查询图像I<sub>q</sub>的排序概率f(w),<maths num="0004"><![CDATA[<math><mrow><mi>f</mi><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>&lambda;</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><mo>&CenterDot;</mo><msub><mi>p</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>w</mi><mo>|</mo><msub><mi>I</mi><mi>q</mi></msub><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>将第i次检索中后验概率及稳定性因子乘积,在1≤i≤N对上述乘积求和,从而衡量出每个关键词标注查询图像的排序概率,用于实现融合伪相关反馈与检索的自动图像标注,对查询图像I<sub>q</sub>进行标注;步骤6:根据得到的每个关键词w的排序概率进行排序,选择最后的关键词列表。
地址 100044北京市西直门外上园村3号