主权项 |
1、一种融合伪相关反馈与检索的自动图像标注方法,其特征在于,包含:步骤1:在已标注的图像库中对未标注的查询图像I<sub>q</sub>进行检索,得到k个相关图像I<sub>r</sub>及相关图像的关键词集合Ψ<sub>w</sub>;步骤2:根据k个相关图像提取均值向量I<sub>mean</sub>作为新的查询向量,重复步骤1,直到最大迭代次数N;步骤3:计算每个关键词W,w∈Ψ<sub>w</sub>标注查询图像I<sub>q</sub>的后验概率p(w|I<sub>q</sub>);后验概率p(w|I<sub>q</sub>)由相关图像与查询图像之间的相似性度量p(w|I<sub>r</sub>)来确定,即p(w|I<sub>q</sub>)=p(w|I<sub>r</sub>)·p(I<sub>r</sub>|I<sub>q</sub>);其中p(I<sub>r</sub>|I<sub>q</sub>)=ω<sub>r</sub>·S(I<sub>r</sub>|I<sub>q</sub>);p(w|I<sub>r</sub>)当关键词W标注相关图像I<sub>r</sub>时为1,否则为0;S(I<sub>r</sub>|I<sub>q</sub>)=exp(-D(I<sub>r</sub>,I<sub>q</sub>)),<maths num="0001"><![CDATA[<math><mrow><msub><mi>ω</mi><mi>r</mi></msub><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mfrac><mrow><mo>-</mo><mi>D</mi><msup><mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>r</mi></msub><mo>,</mo><msub><mi>I</mi><mi>mean</mi></msub><mo>)</mo></mrow></mrow><mn>2</mn></msup></mrow><mrow><mn>2</mn><msup><mi>σ</mi><mn>2</mn></msup></mrow></mfrac><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>D(I<sub>r</sub>,I<sub>q</sub>)为查询图像与相关图像之间的欧式距离度量;D(I<sub>r</sub>,I<sub>mean</sub>)为相关图像与提取的均值向量之间的欧式距离度量;σ为相关图像与提取的均值向量之间纬度上的标准差;重复步骤1至3,直到预先设定的最大迭代次数N;步骤4:计算每个关键词W,<maths num="0002"><![CDATA[<math><mrow><mi>w</mi><mo>∈</mo><munderover><mo>∪</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>Ψ</mi><mi>w</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths>在每轮关键词集合中的稳定性因子λ<sub>i</sub>(w),i=1,2,...,N;步骤5:根据后验概率p(w|I<sub>q</sub>)及稳定性因子λ<sub>i</sub>(w),i=1,2,...,N的值,计算每个关键词w,<maths num="0003"><![CDATA[<math><mrow><mi>w</mi><mo>∈</mo><munderover><mo>∪</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>Ψ</mi><mi>w</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths>标注查询图像I<sub>q</sub>的排序概率f(w),<maths num="0004"><![CDATA[<math><mrow><mi>f</mi><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>λ</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><mo>·</mo><msub><mi>p</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>w</mi><mo>|</mo><msub><mi>I</mi><mi>q</mi></msub><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>将第i次检索中后验概率及稳定性因子乘积,在1≤i≤N对上述乘积求和,从而衡量出每个关键词标注查询图像的排序概率,用于实现融合伪相关反馈与检索的自动图像标注,对查询图像I<sub>q</sub>进行标注;步骤6:根据得到的每个关键词w的排序概率进行排序,选择最后的关键词列表。 |