发明名称 基于同时融合多视角特征及多标签信息的支持向量机分类方法
摘要 本发明实施例公开了一种基于同时融合多视角特征及多标签信息的支持向量机分类方法,包括以下步骤:输入多视角特征训练数据以及每个数据所对应的多标签信息,建立同时融合多视角特征及多标签信息的支持向量机分类器的数学模型,设定各个项的对应权重因子的值;训练和学分类器的各个参数,运用循环迭代算法更新目标优化式的各个参数变量,直到两次迭代的整体目标函数值之差的绝对值小于预设的阈值时停止,并且采用更新计算某个参数时,固定其他参数值的策略;用训练得到的分类器,对实际数据进行多标签分类或预测。本发明用于提供一种技术在支持向量机分类的同时,学得到新的数据空间里的一个统一的数据表达形式,提高了分类器的准确率。
申请公布号 CN102982344A 申请公布日期 2013.03.20
申请号 CN201210452040.0 申请日期 2012.11.12
申请人 浙江大学 发明人 方正;张仲非
分类号 G06K9/62(2006.01)I;G06F17/30(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 杭州宇信知识产权代理事务所(普通合伙) 33231 代理人 张宇娟;施海寅
主权项 1.一种基于同时融合多视角特征及多标签信息的支持向量机分类方法,其特征在于,包括以下步骤S10至S30:S10,输入多视角特征训练数据以及每个数据所对应的多标签信息,建立同时融合多视角特征及多标签信息的支持向量机MVMLSVM分类器的数学模型,设定各个项的对应权重因子的值,其具体包括S101至S103,S101,输入给定的多视角特征数据以及每个数据的多标签信息,<img file="FDA00002390941000011.GIF" wi="443" he="77" /><img file="FDA00002390941000012.GIF" wi="218" he="78" /><img file="FDA00002390941000013.GIF" wi="273" he="77" />i∈{1,2,…,n},v∈{1,2,…,V},l∈{1,2,…,L},其中L是标签的种数,d<sub>v</sub>是第v个视角特征的维度,<img file="FDA00002390941000014.GIF" wi="43" he="62" />表示数据<img file="FDA00002390941000015.GIF" wi="45" he="55" />在第l种标签上的类属关系,<img file="FDA00002390941000016.GIF" wi="44" he="62" />值为+1表示数据<img file="FDA00002390941000017.GIF" wi="45" he="55" />属于第l种标签,-1表示不属于,采用矩阵形式来表达数据和数据所附有的标签信息,分别用X<sup>v</sup>,v∈{1,2,…,V}和<img file="FDA00002390941000018.GIF" wi="41" he="55" />来表示,其中,<img file="FDA00002390941000019.GIF" wi="343" he="71" /><img file="FDA000023909410000110.GIF" wi="172" he="84" /><img file="FDA000023909410000111.GIF" wi="41" he="55" />的每一列<img file="FDA000023909410000112.GIF" wi="54" he="69" />属于L维的标签空间<img file="FDA000023909410000113.GIF" wi="69" he="61" />即<img file="FDA000023909410000114.GIF" wi="169" he="84" /><img file="FDA000023909410000115.GIF" wi="290" he="72" />而<img file="FDA000023909410000116.GIF" wi="41" he="55" />的每一行的转置后的列向量表示各个数据在第l种标签上的类属关系,用Y<sup>l</sup>表示,<img file="FDA000023909410000117.GIF" wi="207" he="91" />S102,在对标签集合中的每一个标签训练一个相应的二分类分类器时,把具有选中的这个标签的数据作为正例样本,没有此标签的样本都作为负例样本,对于标签集中的第l种标签,要训练得到它对应的多视角多标签信息融合的分类器,方法如下:首先将原始数据的多视角特征通过一致性统筹函数<img file="FDA000023909410000118.GIF" wi="317" he="124" />进行特征融合,并且引入训练数据的多标签信息作为正则项因子<img file="FDA000023909410000119.GIF" wi="960" he="81" />进行调节优化,其中<img file="FDA000023909410000120.GIF" wi="195" he="56" />是学习得到的数据在V个视角特征上的一致性表达,d<sub>g</sub>是每个数据新的维度,<img file="FDA000023909410000121.GIF" wi="676" he="80" />是V个视角特征各自变换到G的投影映射,然后将针对第l种标签学习得到的数据一致性表达形式G作为相应支持向量机的输入,训练分类器,整个过程通过以下整合的目标函数优化求解得到各个参数:<maths num="0001"><![CDATA[<math><mrow><msub><mi>min</mi><mrow><mi>G</mi><mo>,</mo><mo>{</mo><msup><mi>P</mi><mi>v</mi></msup><mo>}</mo><mo>,</mo><mi>&beta;</mi></mrow></msub><mi>&gamma;</mi><munderover><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mi>V</mi></munderover><msup><mrow><mo>|</mo><mo>|</mo><mi>G</mi><mo>-</mo><msup><mi>P</mi><mi>v</mi></msup><msup><mi>X</mi><mi>v</mi></msup><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>+</mo><mi>&lambda;</mi><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>&beta;</mi><mi>i</mi></msub><msub><mi>&beta;</mi><mi>j</mi></msub><mi>k</mi><mrow><mo>(</mo><msub><mi>g</mi><mi>i</mi></msub><mo>,</mo><msub><mi>g</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><mo>-</mo><mi>&eta;</mi><mfrac><mn>1</mn><msup><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mn>2</mn></msup></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mi>V</mi></munderover><mi>tr</mi><mrow><mo>(</mo><mi>H</mi><msup><mrow><mo>(</mo><msup><mi>P</mi><mi>v</mi></msup><msup><mi>X</mi><mi>v</mi></msup><mo>)</mo></mrow><mi>T</mi></msup><mrow><mo>(</mo><msup><mi>P</mi><mi>v</mi></msup><msup><mi>X</mi><mi>v</mi></msup><mo>)</mo></mrow><mi>H</mi><msup><mi>Y</mi><mi>T</mi></msup><mi>Y</mi><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0003"><![CDATA[<math><mrow><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>L</mi><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>,</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>k</mi><mrow><mo>(</mo><msub><mi>g</mi><mi>j</mi></msub><mo>,</mo><msub><mi>g</mi><mi>i</mi></msub><mo>)</mo></mrow><msub><mi>&beta;</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths>S103,设定对应项的权重因子,γ,λ,η根据实际应用情况设定,预设50,100,50作为默认值;S20,训练和学习分类器的各个参数,运用循环迭代算法更新目标优化式的各个参数变量,直到两次迭代的整体目标函数值之差的绝对值小于预设的阈值时停止,并且采用更新计算某个参数时,固定其他参数值的策略,其中,在一次循环迭代里,又分为以下三个步骤:S201,更新计算每个视角特征对应的投影映射P<sup>v</sup>(v=1,2,…,V)的每一列;<maths num="0004"><![CDATA[<math><mfenced open='' close=''><mtable><mtr><mtd><msubsup><mi>p</mi><mi>k</mi><mi>v</mi></msubsup><mo>=</mo><mfrac><mrow><msub><mi>u</mi><mi>k</mi></msub><mo>-</mo><msup><mi>P</mi><mi>v</mi></msup><msub><mi>n</mi><mi>k</mi></msub></mrow><msub><mi>N</mi><mi>kk</mi></msub></mfrac><mo>+</mo><msubsup><mi>p</mi><mi>k</mi><mi>v</mi></msubsup></mtd><mtd><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><msub><mi>d</mi><mi>v</mi></msub></mtd></mtr></mtable></mfenced></math>]]></maths>其中,N<sub>kk</sub>是矩阵<img file="FDA00002390941000025.GIF" wi="563" he="111" />的第k行第k列个元素,其中<img file="FDA00002390941000026.GIF" wi="308" he="73" />n<sub>k</sub>是N的第k列,u<sub>k</sub>是矩阵U=G(X<sup>v</sup>)<sup>T</sup>的第k列,S202,计算支持向量机分类器的分类系数β;β=(λI<sub>n</sub>+I<sup>0</sup>K)<sup>-1</sup>I<sup>0</sup>Y<sup>l</sup>其中<maths num="0005"><![CDATA[<math><mrow><msup><mi>I</mi><mn>0</mn></msup><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>I</mi><mi>sv</mi></msub></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>S203,更新计算各个视角特征映射变换后的数据一致性表达形式G的每一列;<maths num="0006"><![CDATA[<math><mfenced open='' close=''><mtable><mtr><mtd><msubsup><mi>g</mi><mi>k</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mo>=</mo><msubsup><mi>g</mi><mi>k</mi><mi>t</mi></msubsup><mo>-</mo><mi>D</mi><msup><mrow><mo>(</mo><msubsup><mi>g</mi><mi>k</mi><mi>t</mi></msubsup><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><msub><mo>&dtri;</mo><msubsup><mi>g</mi><mi>k</mi><mi>t</mi></msubsup></msub></mtd><mtd><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>n</mi></mtd></mtr></mtable></mfenced></math>]]></maths>其中<img file="FDA00002390941000031.GIF" wi="123" he="58" />是对角矩阵,定义如下:<maths num="0007"><![CDATA[<math><mrow><msub><mi>D</mi><mi>ad</mi></msub><mrow><mo>(</mo><msubsup><mi>g</mi><mi>k</mi><mi>t</mi></msubsup><mo>)</mo></mrow><mo>=</mo><msub><mi>&delta;</mi><mi>ad</mi></msub><mrow><mo>(</mo><mrow><mo>(</mo><mn>2</mn><mrow><mo>(</mo><mi>&gamma;V</mi><mo>+</mo><mi>&lambda;</mi><msubsup><mi>&beta;</mi><mi>k</mi><mn>2</mn></msubsup><mo>)</mo></mrow><mo>+</mo><mn>2</mn><mrow><mo>(</mo><msup><mrow><mo>(</mo><msub><mi>q</mi><mi>k</mi></msub><mo>-</mo><msub><mi>y</mi><mi>k</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msubsup><mi>&beta;</mi><mi>k</mi><mn>2</mn></msubsup><mo>)</mo></mrow><mo>[</mo><mi>k</mi><mo>&Element;</mo><msub><mi>n</mi><mi>sv</mi></msub><mo>]</mo><mo>)</mo></mrow><msubsup><mi>g</mi><mi>k</mi><mi>t</mi></msubsup></mrow></mrow></math>]]></maths><maths num="0008"><![CDATA[<math><mrow><mo>+</mo><msub><mrow><mn>2</mn><mrow><mo>(</mo><mi>G&beta;</mi><mo>)</mo></mrow><msup><mrow><mo>(</mo><mi>G&beta;</mi><mo>)</mo></mrow><mi>T</mi></msup><msubsup><mi>g</mi><mi>k</mi><mi>t</mi></msubsup><mo>[</mo><mi>k</mi><mo>&Element;</mo><msub><mi>n</mi><mi>sv</mi></msub><mo>]</mo><mo>+</mo><mn>2</mn><msubsup><mi>&beta;</mi><mi>k</mi><mn>2</mn></msubsup><msub><mi>G</mi><mi>sv</mi></msub><msup><msub><mi>G</mi><mi>sv</mi></msub><mi>T</mi></msup><msubsup><mi>g</mi><mi>k</mi><mi>t</mi></msubsup><mo>)</mo></mrow><mi>a</mi></msub><mo>/</mo><msub><mrow><mo>(</mo><msubsup><mi>g</mi><mi>k</mi><mi>t</mi></msubsup><mo>)</mo></mrow><mi>a</mi></msub></mrow></math>]]></maths><maths num="0009"><![CDATA[<math><mrow><msub><mi>q</mi><mi>i</mi></msub><mo>=</mo><msubsup><mi>k</mi><mi>i</mi><mi>T</mi></msubsup><mi>&beta;</mi><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msubsup><mi>g</mi><mi>j</mi><mi>T</mi></msubsup><msub><mi>g</mi><mi>i</mi></msub><msub><mi>&beta;</mi><mi>j</mi></msub><mo>,</mo></mrow></math>]]></maths><maths num="0010"><![CDATA[<math><mrow><msub><mi>G</mi><mi>sv</mi></msub><msup><msub><mi>G</mi><mi>sv</mi></msub><mi>T</mi></msup><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>sv</mi></msub></munderover><msub><mi>g</mi><mi>i</mi></msub><msubsup><mi>g</mi><mi>i</mi><mi>T</mi></msubsup></mrow></math>]]></maths><img file="FDA00002390941000036.GIF" wi="68" he="67" />定义为:<maths num="0011"><![CDATA[<math><mrow><msub><mo>&dtri;</mo><msubsup><mi>g</mi><mi>k</mi><mi>t</mi></msubsup></msub><mo>=</mo><mi>&gamma;</mi><munderover><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mi>V</mi></munderover><mrow><mo>(</mo><mn>2</mn><msub><mi>g</mi><mi>k</mi></msub><mo>-</mo><mn>2</mn><msup><mi>P</mi><mi>v</mi></msup><msubsup><mi>x</mi><mi>k</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>+</mo><mi>&lambda;</mi><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mn>2</mn><msub><mi>&beta;</mi><mi>k</mi></msub><msub><mi>&beta;</mi><mi>j</mi></msub><msub><mi>g</mi><mi>j</mi></msub></mrow></math>]]></maths><maths num="0012"><![CDATA[<math><mrow><mo>+</mo><mn>2</mn><mrow><mo>(</mo><mrow><mo>(</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mrow><mo>(</mo><msub><mi>q</mi><mi>k</mi></msub><mo>-</mo><msub><mi>y</mi><mi>k</mi></msub><mo>)</mo></mrow><msub><mi>&beta;</mi><mi>j</mi></msub><msub><mi>g</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>[</mo><mi>k</mi><mo>&Element;</mo><msub><mi>n</mi><mi>sv</mi></msub><mo>]</mo><mo>+</mo><msub><mi>&beta;</mi><mi>k</mi></msub><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>sv</mi></msub></munderover><mrow><mo>(</mo><msub><mi>q</mi><mi>i</mi></msub><mo>-</mo><msub><mi>y</mi><mi>i</mi></msub><mo>)</mo></mrow><msub><mi>g</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths>整个迭代过程直到两次迭代的整体目标函数值之差的绝对值小于10<sup>-5</sup>或最大迭代次数超过100停止,最后得到的每个多视角特征的投影映射矩阵P<sup>v</sup>(v=1,2,…,V),数据的一致性表达形式G,以及支持向量机的分类系数β就是训练阶段所要得到的基于同时融合多视角特征多标签信息支持向量机分类器MVMLSVM的参数;S30,用训练得到的分类器,对实际数据进行多标签分类或预测,具体包括如下步骤S301至S302,S301,将待分类的数据的每一视角的特征通过对应的投影映射矩阵<img file="FDA00002390941000039.GIF" wi="132" he="61" />变换得到新的数据表达<img file="FDA000023909410000310.GIF" wi="200" he="76" />得到每个视角变换后的结果<img file="FDA000023909410000311.GIF" wi="166" he="61" />后,通过<img file="FDA000023909410000312.GIF" wi="356" he="125" />将新的数据空间里的每个视角变换后的结果<img file="FDA000023909410000313.GIF" wi="169" he="62" />整合起来得到统一的表达形式G<sub>test</sub>,S302,用训练阶段学习得到的参数G计算K<sub>test</sub>=G<sup>T</sup>G<sub>test</sub>,以及用训练阶段得到的支持向量机的分类系数β计算<img file="FDA000023909410000314.GIF" wi="274" he="76" />根据所得<img file="FDA000023909410000315.GIF" wi="247" he="61" />结果的正负性,判断待分类数据是否属于分类器对应的标签类,正的值,表示需要判断的待分类数据属于分类器所对应的标签类;负的值,表示需要判断的待分类数据不属于分类器所对应的标签类。
地址 310027 浙江省杭州市西湖区浙大路38号