基于综合型线性分类器和解析型字典的行为识别方法,申请号CN201610204795.7-传众专利搜索

发明名称	基于综合型线性分类器和解析型字典的行为识别方法
摘要	本发明公开了一种可提高行为识别准确率与运行速度的基于综合型线性分类器和解析型字典的行为识别方法，首先对训练集和测试集样本进行预处理，对行为视频样本采用一种高层次的表示方法，每个样本对应一个语义丰富的特征列向量；优化学得到解析型字典<i>Ω</i>和综合型线性分类器<i>R</i>；获得测试样本的编码系数；将测试样本的编码系数、综合型线性分类器<i>R</i>一起输入到分类器中，得到最终分类结果。
申请公布号	CN105938544A	申请公布日期	2016.09.14
申请号	CN201610204795.7	申请日期	2016.04.05
申请人	大连理工大学	发明人	郭艳卿;王久君;郭君;孔祥维
分类号	G06K9/00(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I	主分类号	G06K9/00(2006.01)I
代理机构	大连非凡专利事务所 21220	代理人	闪红霞
主权项	一种基于综合型线性分类器和解析型字典的行为识别方法，其特征在于按照如下步骤进行：S1，优化学习得到解析型字典<img file="498100dest_path_image001.GIF" wi="21" he="19" />和综合型线性分类器<i>R</i>：对训练集数据建立模型，通过交替迭代的优化策略最小化目标函数，进而获得解析型字典<img file="215520dest_path_image001.GIF" wi="21" he="19" />、综合型线性分类器<i>R</i>和编码系数X；所述模型如下：<img file="548413dest_path_image002.GIF" wi="293" he="69" />（1）上述模型（1）中：<img file="300468dest_path_image003.GIF" wi="16" he="19" />为人工设置的权重参数，用于调节各项之间的相对大小关系；<i>H</i>是包含样本类别信息的标签矩阵；<i>T</i> 是控制编码系数<i>X</i>的稀疏度的正整数；<img file="122930dest_path_image004.GIF" wi="21" he="18" />是解析型字典<img file="327647dest_path_image001.GIF" wi="21" he="19" />的约束集合，设定<img file="464230dest_path_image004.GIF" wi="21" he="18" />为<i>F</i>范数相对小的矩阵集合，则模型（1）表示为：<img file="903800dest_path_image005.GIF" wi="325" he="72" />（2）其中，<i>β</i>是决定<img file="834847dest_path_image006.GIF" wi="38" he="30" />项贡献的标量参数，模型（2）中的第一部分是基本的解析型字典<img file="589176dest_path_image001.GIF" wi="21" he="19" />学习模型：<img file="263871dest_path_image007.GIF" wi="206" he="64" />其中，<img file="dest_path_image008.GIF" wi="83" he="30" />代表稀疏重构误差，<i>x</i><sub><i>i</i></sub>是编码系数<i>X</i> 的第<i>i</i>列，其0范数约束使得<i>x</i><sub><i>i</i></sub>中非零元素个数不大于<i>T</i>；模型（2）中的第二部分<img file="662622dest_path_image009.GIF" wi="80" he="31" />是基于综合型线性分类器的误差项<i>R</i>，设置<i>C</i>等于样本的类别总数，矩阵<img file="92467dest_path_image010.GIF" wi="68" he="19" />的每一列<img file="271775dest_path_image011.GIF" wi="158" he="28" />为仅有1个非零元素的列向量，其非零元素的位置就对应于训练样本的类别信息，综合型线性分类器在编码系数和样本的类别标签之间建立一个对应关系<img file="484582dest_path_image012.GIF" wi="60" he="19" />；模型（2）中的第三部分<img file="65736dest_path_image013.GIF" wi="34" he="37" />是解析型字典<img file="335656dest_path_image001.GIF" wi="21" he="19" />的约束；S2，获得测试集的编码系数：用训练好的解析型字典<img file="2261dest_path_image001.GIF" wi="21" he="19" />，根据<img file="18758dest_path_image014.GIF" wi="52" he="22" />对测试样本进行编码，其中<i>y</i>表示待编码的样本数据，<i>x</i>表示样本的编码系数；S3，将测试样本的编码系数<i>x</i>和综合型线性分类器<i>R</i>一起输入基于最小化分类误差原理的分类器中，根据样本库中的类别数目<i>C</i>，设定一个标准的标签矩阵<i>L</i>，标签矩阵的每一个列向量<i>l</i><sub><i>j</i></sub>，<i>j</i>=1,2,...,<i>C</i>代表特定的类别信息，分类准则为<img file="516735dest_path_image015.GIF" wi="269" he="43" />（3）使式中目标函数值最小的列向量<i>l</i><sub><i>predict</i></sub>包含测试样本的类别信息，即可由<i>l</i><sub><i>predict</i></sub>得到最终的分类结果。
地址	116000 辽宁省大连市高新园区凌工路2号