主权项 |
一种基于较大编码系数强化的稀疏编码方法,其特征在于,包括应用于稀疏编码的方法(A Larger Coefficients Emphasis Framework for Sparse Representation,LCE‑SRC),和应用于鲁棒稀疏编码的方法:其中,本发明应用于稀疏编码的方法(A Larger Coefficients Emphasis Framework for Sparse Representation,LCE‑SRC),包括步骤(a)‑(e):a:首先提取1个测试样本的特征,将其表示为一个列向量,同样也提取k个训练样本的特征,将其表示为k列的矩阵;b:用主成分分析方法(PCA)将测试样本列向量和训练样本矩阵的每个列向量降维至m维,所以得到m维的测试样本列向量和大小为m×k的训练样本矩阵,其中,称降维后的训练样本矩阵为训练样本字典;c:稀疏表示:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>α</mi><mo>=</mo><mi>arg</mi><mi> </mi><munder><mi>min</mi><mi>α</mi></munder><mo>|</mo><mo>|</mo><mi>x</mi><mo>-</mo><mi>D</mi><mi>α</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>λ</mi><mo>|</mo><mo>|</mo><mi>α</mi><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000883898020000011.GIF" wi="1038" he="119" /></maths>其中式(1)是稀疏编码(Sparse Representation based Classification,SRC)的拉格朗日算子表示公式,x是测试样本列向量,D是训练样本字典,α是式(1)中唯一的自变量,是编码系数向量;e=y‑Dα,其中e为编码冗余;式(1)通过第一项编码冗余的l<sub>2</sub>范数和第二项编码系数的l<sub>1</sub>范数使得训练样本表示测试样本和编码系数向量稀疏,最终得到最优稀疏编码系数α,即通过求式(1)最小值得到α;d:样本重构;<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><munder><mi>min</mi><mi>i</mi></munder><mi> </mi><msub><mi>r</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mo>|</mo><mo>|</mo><mi>x</mi><mo>-</mo><msub><mi>Dδ</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>α</mi><mo>)</mo></mrow><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>β</mi><mfrac><mrow><mo>|</mo><mo>|</mo><mi>x</mi><mo>-</mo><msub><mi>Dδ</mi><mi>i</mi></msub><mrow><mo>(</mo><msup><mi>α</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup></mrow><mrow><msub><mi>δ</mi><mi>i</mi></msub><msub><mrow><mo>(</mo><msup><mi>α</mi><mo>′</mo></msup><mo>)</mo></mrow><mi>max</mi></msub><mo>×</mo><mi>l</mi><mi>e</mi><mi>n</mi><mi>g</mi><mi>t</mi><mi>h</mi><mrow><mo>(</mo><mrow><msub><mi>δ</mi><mi>i</mi></msub><mrow><mo>(</mo><msup><mi>α</mi><mo>′</mo></msup><mo>)</mo></mrow></mrow><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000883898020000012.GIF" wi="1355" he="151" /></maths>在式(2)中,第一项是标准重构误差,根据训练样本字典与训练样本的每一类对应的稀疏编码系数δ<sub>i</sub>(α)相乘,得到每一类的重构样本,然后将测试样本和重构样本相减,得到标准重构误差;加权的第二项中,α'是α中最大的一部分元素:根据α中的元素大小进行排序,选出前十项组成α',即最大的一部分元素,δ<sub>i</sub>(α')是由α'向量中第i类对应的元素组成的向量,δ<sub>i</sub>(α′)<sub>max</sub>是α'中最大的元素值,length(δ<sub>i</sub>(α′))是δ<sub>i</sub>(α')的长度,β为加权系数,选择其中较大的一部分编码系数,也将训练样本字典与之相乘,得到新的重构样本,然后将测试样本和新的重构样本相减,得到新的标准重构误差,两类误差和的最小值对应的类别即为测试样本所属类别;e:读取其他测试样本,返回a步骤继续识别分类。 |