发明名称 一种基于互正则化约束子空间表达的多视角数据聚类方法
摘要 本发明公开了一种基于互正则化约束子空间表达的多视角数据聚类方法,该方法包括以下步骤:组成多视角数据库,提取不同视角数据的视角特征;选择互正则化方法,确定互正则化约束;基于一优化目标函数和不同视角数据的视角特征,得到所有样本的协同表示向量;将协同表示向量按照其所对应的样本顺序排序,得到子空间表达矩阵;对子空间表达矩阵进行处理,得到亲和矩阵;根据需要聚类的数目分割亲和矩阵,得到多视角数据库的样本聚类结果。本发明利用子空间表达来挖掘样本之间的隐含结构信息,采用两种互正则化方式来约束不同视角的子空间表达,以利用多视角的互补信息,进一步加强样本集隐含结构信息的表示,从而能够广泛的应用于多视角数据聚类。
申请公布号 CN103617292B 申请公布日期 2017.02.22
申请号 CN201310687876.3 申请日期 2013.12.16
申请人 中国科学院自动化研究所 发明人 王亮;谭铁牛;赫然;尹奇跃
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 一种基于互正则化约束子空间表达的多视角数据聚类方法,其特征在于,该方法包括以下步骤:步骤S1,收集多视角数据样本,组成多视角数据库,并对不同视角的数据,分别提取其视角特征;步骤S2,选择互正则化方法,并确定所选择的互正则化方法的互正则化约束;步骤S3,根据所述步骤S2选定的互正则化方法,基于一优化目标函数和不同视角的数据的视角特征,学习得到所述多视角数据库中所有样本的协同表示向量;步骤S4,将所述协同表示向量按照其所对应的样本顺序按列排序,得到子空间表达矩阵;步骤S5,对所述子空间表达矩阵进行处理,得到度量所述多视角数据库中样本相似性的亲和矩阵;步骤S6,根据需要聚类的数目,对于所述亲和矩阵进行分割,得到所述多视角数据库的样本聚类结果;所述优化目标函数表示为:<maths num="0001"><math><![CDATA[<mrow><msub><mi>min</mi><mrow><msubsup><mi>z</mi><mi>i</mi><mi>v</mi></msubsup><mo>,</mo><msubsup><mi>z</mi><mi>i</mi><mi>w</mi></msubsup></mrow></msub><msub><mi>&Sigma;</mi><mi>v</mi></msub><mi>l</mi><mi>o</mi><mi>s</mi><mi>s</mi><mrow><mo>(</mo><msubsup><mi>z</mi><mi>i</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>+</mo><msub><mi>&alpha;&Sigma;</mi><mi>v</mi></msub><mi>r</mi><mi>e</mi><mi>g</mi><mrow><mo>(</mo><msubsup><mi>z</mi><mi>i</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>+</mo><msub><mi>&beta;&Sigma;</mi><mrow><mi>v</mi><mo>&NotEqual;</mo><mi>w</mi></mrow></msub><mi>c</mi><mi>o</mi><mo>_</mo><mi>r</mi><mi>e</mi><mi>g</mi><mrow><mo>(</mo><msubsup><mi>z</mi><mi>i</mi><mi>v</mi></msubsup><mo>,</mo><msubsup><mi>z</mi><mi>i</mi><mi>w</mi></msubsup><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0001020667190000011.GIF" wi="1587" he="81" /></maths>其中,<img file="FDA0001020667190000012.GIF" wi="63" he="69" />是样本i在v视角下的子空间表达,<img file="FDA0001020667190000013.GIF" wi="74" he="74" />是样本i在w视角下的子空间表达,<img file="FDA0001020667190000014.GIF" wi="211" he="67" />是<img file="FDA0001020667190000015.GIF" wi="59" he="72" />的损失函数,<img file="FDA0001020667190000016.GIF" wi="201" he="73" />是对<img file="FDA0001020667190000017.GIF" wi="60" he="71" />的正则化约束,<img file="FDA0001020667190000018.GIF" wi="372" he="73" />是对同一个样本不同视角下子空间表达的互正则化约束,α和β是预设的比例系数。
地址 100190 北京市海淀区中关村东路95号