基于较大编码系数强化的稀疏编码方法,申请号CN201310168219.8-传众专利搜索

发明名称	基于较大编码系数强化的稀疏编码方法
摘要	本发明提供了一种基于较大编码系数强化的稀疏编码方法，方法流程为：首先构造测试样本列向量和训练样本矩阵。第二，用主成分分析方法(PCA)将两者降维,降维后的训练样本矩阵也叫做字典。第三，将测试样本列向量表示为字典的线性组合，表示系数为稀疏编码系数。最后，字典与每一类对应的稀疏编码系数相乘，得到每一类的重构样本，然后将测试样本和重构样本相减，得到标准重构误差；同样选择其中较大的一部分编码系数，将字典与之相乘，也得到一种重构样本，然后将测试样本和重构样本相减，得到另一种重构误差，两类误差的最小值对应的类别即为测试样本所属类别。经大量实验验证，本发明在人脸识别中得到了应用，识别率很高，有很好的性能与适用性。
申请公布号	CN103226714B	申请公布日期	2016.04.06
申请号	CN201310168219.8	申请日期	2013.05.09
申请人	山东大学	发明人	江铭炎;潘婷婷;贲晛烨;李斐;张鹏;孙孟磊
分类号	G06K9/66(2006.01)I	主分类号	G06K9/66(2006.01)I
代理机构	济南金迪知识产权代理有限公司 37219	代理人	吕利敏
主权项	一种基于较大编码系数强化的稀疏编码方法，其特征在于，包括应用于稀疏编码的方法(A Larger Coefficients Emphasis Framework for Sparse Representation,LCE‑SRC)，和应用于鲁棒稀疏编码的方法：其中，本发明应用于稀疏编码的方法(A Larger Coefficients Emphasis Framework for Sparse Representation,LCE‑SRC)，包括步骤(a)‑(e)：a：首先提取1个测试样本的特征，将其表示为一个列向量，同样也提取k个训练样本的特征，将其表示为k列的矩阵；b：用主成分分析方法(PCA)将测试样本列向量和训练样本矩阵的每个列向量降维至m维，所以得到m维的测试样本列向量和大小为m×k的训练样本矩阵，其中，称降维后的训练样本矩阵为训练样本字典；c：稀疏表示：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>α</mi><mo>=</mo><mi>arg</mi><mi> </mi><munder><mi>min</mi><mi>α</mi></munder><mo>\|</mo><mo>\|</mo><mi>x</mi><mo>-</mo><mi>D</mi><mi>α</mi><mo>\|</mo><msubsup><mo>\|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>λ</mi><mo>\|</mo><mo>\|</mo><mi>α</mi><mo>\|</mo><msub><mo>\|</mo><mn>1</mn></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000883898020000011.GIF" wi="1038" he="119" /></maths>其中式(1)是稀疏编码(Sparse Representation based Classification，SRC)的拉格朗日算子表示公式，x是测试样本列向量，D是训练样本字典，α是式(1)中唯一的自变量，是编码系数向量；e＝y‑Dα，其中e为编码冗余；式(1)通过第一项编码冗余的l<sub>2</sub>范数和第二项编码系数的l<sub>1</sub>范数使得训练样本表示测试样本和编码系数向量稀疏，最终得到最优稀疏编码系数α，即通过求式(1)最小值得到α；d：样本重构；<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><munder><mi>min</mi><mi>i</mi></munder><mi> </mi><msub><mi>r</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mo>\|</mo><mo>\|</mo><mi>x</mi><mo>-</mo><msub><mi>Dδ</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>α</mi><mo>)</mo></mrow><mo>\|</mo><msubsup><mo>\|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>β</mi><mfrac><mrow><mo>\|</mo><mo>\|</mo><mi>x</mi><mo>-</mo><msub><mi>Dδ</mi><mi>i</mi></msub><mrow><mo>(</mo><msup><mi>α</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>\|</mo><msubsup><mo>\|</mo><mn>2</mn><mn>2</mn></msubsup></mrow><mrow><msub><mi>δ</mi><mi>i</mi></msub><msub><mrow><mo>(</mo><msup><mi>α</mi><mo>′</mo></msup><mo>)</mo></mrow><mi>max</mi></msub><mo>×</mo><mi>l</mi><mi>e</mi><mi>n</mi><mi>g</mi><mi>t</mi><mi>h</mi><mrow><mo>(</mo><mrow><msub><mi>δ</mi><mi>i</mi></msub><mrow><mo>(</mo><msup><mi>α</mi><mo>′</mo></msup><mo>)</mo></mrow></mrow><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000883898020000012.GIF" wi="1355" he="151" /></maths>在式(2)中，第一项是标准重构误差，根据训练样本字典与训练样本的每一类对应的稀疏编码系数δ<sub>i</sub>(α)相乘，得到每一类的重构样本，然后将测试样本和重构样本相减，得到标准重构误差；加权的第二项中，α'是α中最大的一部分元素：根据α中的元素大小进行排序，选出前十项组成α'，即最大的一部分元素，δ<sub>i</sub>(α')是由α'向量中第i类对应的元素组成的向量，δ<sub>i</sub>(α′)<sub>max</sub>是α'中最大的元素值，length(δ<sub>i</sub>(α′))是δ<sub>i</sub>(α')的长度，β为加权系数，选择其中较大的一部分编码系数，也将训练样本字典与之相乘，得到新的重构样本，然后将测试样本和新的重构样本相减，得到新的标准重构误差，两类误差和的最小值对应的类别即为测试样本所属类别；e：读取其他测试样本，返回a步骤继续识别分类。
地址	250100 山东省济南市历城区山大南路27号