发明名称 一种基于带权图的半监督图像分类方法
摘要 本发明涉及半监督图像分类技术,属于计算机多媒体技术领域,该方法包括:在对数字图像进行分割的基础上,提取区域特征并计算各个区域面积占整幅图像面积的比例;使用线性规划构建带权图;使用标签传播的方法在带权图上传递已标注图像的类别信息;最后根据类别信息传递的最终结果,对未标注图像进行分类。本方法使用线性规划构建带权图,其中需要设定的参数为近邻图像的数目,当该参数在较大的范围内变化时,使用本方法得到的图像分类结果比较稳定,从而有效地克服了基于高斯函数构建带权图的方法中参数对分类结果影响较大的问题。
申请公布号 CN101295360B 申请公布日期 2010.06.02
申请号 CN200810105980.6 申请日期 2008.05.07
申请人 清华大学 发明人 戴琼海;李斐;徐文立;尔桂花
分类号 G06K9/46(2006.01)I 主分类号 G06K9/46(2006.01)I
代理机构 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人 廖元秋
主权项 1.一种基于带权图的半监督图像分类方法,其特征在于,包括如下步骤:1)对所有图像进行分割:设一共有N幅图像,对每一幅图像I<sub>m</sub>(1≤m≤N)进行分割得到n<sub>m</sub>个区域,n<sub>m</sub>为自然数;2)对所有图像分割后得到的区域,进行底层视觉特征的抽取;3)计算每幅图像中各个区域面积占整幅图像面积的比例;使用区域属性的集合对图像I<sub>m</sub>描述为:<img file="F2008101059806C00011.GIF" wi="800" he="77" />,其中r<sub>mk</sub>(1≤k≤n<sub>m</sub>)表示图像I<sub>m</sub>中第k个区域的特征,v<sub>mk</sub>(1≤k≤n<sub>m</sub>)表示图像I<sub>m</sub>中第k个区域的面积占整幅图像面积的比例;4)使用线性规划构建带权图;5)使用标签传播的方法在带权图上传递已标注图像的类别信息;6)根据类别信息传递的最终结果,对未标注图像进行分类;所述步骤4)中使用线性规划构建带权图具体包括以下步骤:41)选取第一幅图像I<sub>m</sub>即令m=1;42)根据图像的区域特征和区域面积比例,计算图像I<sub>m</sub>与其它所有图像之间的泥土搬运距离,记作d<sub>EMD</sub>(I<sub>m</sub>,I<sub>1</sub>),d<sub>EMD</sub>(I<sub>m</sub>,I<sub>2</sub>),…,d<sub>EMD</sub>(I<sub>m</sub>,I<sub>k(k≠m)</sub>),…,d<sub>EMD</sub>(I<sub>m</sub>,I<sub>N</sub>);43)根据步骤42)中计算出的泥土搬运距离确定与图像I<sub>m</sub>之间距离最小的K幅近邻图像,记作<img file="F2008101059806C00012.GIF" wi="736" he="78" />其中M<sub>k</sub>(1≤k≤K)表示近邻图像的标号;44)设由图像I<sub>m</sub>对应结点到图像<img file="F2008101059806C00013.GIF" wi="57" he="56" />(1≤k≤K)对应结点的边的权重为<img file="F2008101059806C00014.GIF" wi="120" he="45" />r<sub>mi</sub>与<img file="F2008101059806C00015.GIF" wi="85" he="46" />之间的距离为d<sub>k</sub>(i,j)<img file="F2008101059806C00016.GIF" wi="455" he="57" />基于下述线性规划问题计算<img file="F2008101059806C00017.GIF" wi="97" he="45" />的值:<maths num="0001"><![CDATA[<math><mrow><munder><mi>min</mi><mrow><msub><mi>f</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></mrow></munder><mo>[</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>m</mi></msub></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><msub><mi>M</mi><mi>k</mi></msub></msub></munderover><msub><mi>f</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><msub><mi>d</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>]</mo></mrow></math>]]></maths>(1)其中,待求解的决策变量为f<sub>k</sub>(i,j)<img file="F2008101059806C00019.GIF" wi="629" he="58" />和<img file="F2008101059806C000110.GIF" wi="98" he="46" />(1≤k≤K),它们需要满足如下约束条件:f<sub>k</sub>(i,j)≥0,1≤i≤n<sub>m</sub>,<maths num="0002"><![CDATA[<math><mrow><mn>1</mn><mo>&le;</mo><mi>j</mi><mo>&le;</mo><msub><mi>n</mi><msub><mi>M</mi><mi>k</mi></msub></msub><mo>,</mo></mrow></math>]]></maths>1≤k≤K;    (2)<maths num="0003"><![CDATA[<math><mrow><msub><mi>w</mi><mrow><mi>m</mi><mo>,</mo><msub><mi>M</mi><mi>k</mi></msub></mrow></msub><mo>&GreaterEqual;</mo><mn>0</mn><mo>,</mo></mrow></math>]]></maths>1≤k≤K;    (3)<maths num="0004"><![CDATA[<math><mrow><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><msub><mi>m</mi><mi>k</mi></msub></msub></munderover><msub><mi>f</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>v</mi><mi>mi</mi></msub><mo>,</mo></mrow></math>]]></maths>1≤i≤n<sub>m</sub>;    (4)<maths num="0005"><![CDATA[<math><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>m</mi></msub></munderover><msub><mi>f</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>w</mi><mrow><mi>m</mi><mo>,</mo><msub><mi>m</mi><mi>k</mi></msub></mrow></msub><mo>&CenterDot;</mo><msub><mi>v</mi><mrow><msub><mi>m</mi><mi>k</mi></msub><mo>,</mo><mi>j</mi></mrow></msub><mo>,</mo></mrow></math>]]></maths><maths num="0006"><![CDATA[<math><mrow><mn>1</mn><mo>&le;</mo><mi>j</mi><mo>&le;</mo><msub><mi>n</mi><msub><mi>M</mi><mi>k</mi></msub></msub><mo>,</mo></mrow></math>]]></maths>1≤k≤K;    (5)<maths num="0007"><![CDATA[<math><mrow><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>w</mi><mrow><mi>m</mi><mo>,</mo><msub><mi>M</mi><mi>k</mi></msub></mrow></msub><mo>=</mo><mn>1</mn><mo>.</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow></math>]]></maths>45)如果<img file="F2008101059806C00025.GIF" wi="303" he="52" />则令由图像I<sub>m</sub>对应结点到图像I<sub>k</sub>对应结点的边的权重为w<sub>mk</sub>=0,即由图像I<sub>m</sub>对应结点到图像I<sub>k</sub>对应结点的边不存在;46)m的取值加1,如果m ≤N,则转至步骤42),直至所有图像都被选取。
地址 100084 北京市海淀区清华园